• Machine Learning Meetup #36

    Nubank's HQ

    /!\ The 1st talk will be in English == 1ª: Leading in Data Science projects, tools and tricks == Abstract: This talk is aimed at lead roles of data science projects, like technical leaders or project managers. We will present tools and tricks to deal with the peculiarities of involving Data Science in a regular software project: best engineering practices, tricks for doing Agile, metrics, the use of experiments, common pitfalls, communication with stakeholders. Rafael Carrascosa bio: A native of Córdoba, Argentina and a hacker at the heart, I am very passionate about my trade: Applying Machine Learning. In the past I did some teaching, bit of (successful!) entrepreneurship, a lot of coding, some managing and currently I lead the Applied Machine Learning team at MercadoLibre.

    22
  • Machine Learning Meetup #35

    Nubank's HQ

    == 1ª: A experiência da Mutual com AutoML e Feature Engineering aplicado a crédito == Como ferramentas de Automated Machine Learning podem aumentar a produtividade dos chapters de data science, os benefícios e precauções necessárias para explorar o trade-off entre interpretabilidade e performance no segmento de risco de crédito. — Bio: Patrick Maia é cientista de dados na Mutual, líder do chapter de data science e atua desenvolvendo modelos de classificação e precificação de risco de crédito na Mutual, a maior plataforma de P2P lending entre pessoas físicas do Brasil. == 2ª: Federated Learning == Federated Learning (FL) é uma abordagem de machine learning incialmente idealizada e implementada pelo Google. A ideia central de FL é explorar o potencial de dados armazenados numa rede distribuída e descentralizada de aparelhos (por exemplo, celulares de clientes). No FL, ao invés de todos os dados serem recolhidos, centralizados e usados para treinamentos, updates do modelo são computados nos aparelhos com dados armazenados localmente e então combinados por um servidor para produzir uma nova versão do modelo. — Bio: Gervásio Santos é formado em Ciência da Computação pelo IME-USP e faz Mestrado em Computação no IME-USP com foco em geometria de altas dimensões. É Machine Learning Engineer no Nubank desde o começo de 2019.

    33
  • Machine Learning Meetup #34

    Nubank's HQ

    == 1ª: Machine Learning em Saúde == O rápido aumento na quantidade de dados em saúde tem aberto novas oportunidades para a saúde brasileira. Entre as várias novidades proporcionadas pelo big data, terá destaque o uso de modelos preditivos de inteligência artificial, conhecidos como machine learning. A palestra tem como objetivo apresentar essa área em rápido crescimento, além de seus benefícios, limitações e possíveis uso na área da saúde. Bio: Alexandre Chiavegatto Filho é Professor Livre Docente da Faculdade de Saúde Pública da USP (FSP/USP). Possui graduação em Economia pela Faculdade de Economia e Administração da USP (FEA/USP), doutorado direto em Saúde Pública pela FSP/USP e pós-doutorado na Universidade de Harvard. Em[masked] foi responsável pela disciplina online "Big Data em Saúde no Brasil" da parceria USP-Coursera, que teve mais de 8.500 alunos matriculados e representantes de todos os Estados brasileiros. Atualmente é o pesquisador principal de projetos financiados pela FAPESP, CNPq, Pró-Reitoria da USP e Fundação Lemann. Atuou como professor convidado (2016) e pesquisador visitante (2017 e 2019) na Universidade de Harvard. É o diretor do LABDAPS (Laboratório de Big Data e Análise Preditiva em Saúde) da Faculdade de Saúde Pública da USP, fundado no início de 2017 com o objetivo de desenvolver algoritmos de machine learning que auxiliem na melhoria da atenção à saúde no Brasil. == Random Forest e Decision Tree para previsão de doenças crônicas == A Blue é um software, em desenvolvimento, capaz de integrar diferentes fontes de dados para prever o risco de uma doença crônica, como hipertensão, diabetes e alguns casos de câncer. Tendo início em junho de 2018, o projeto foi aceito em julho para o programa de aceleração do MIT, o Global Startup Lab. Em setembro, ao lado de mais de 400 grupos, a Blue foi escolhida para participar da maior competição de projetos/startups brasileiros(as) organizada por Harvard e pelo MIT durante a Brazil Conference, em abril, após a apresentação no próprio MIT, a Blue foi escolhida o melhor projeto, sendo a campeã da HackBrazil. Hoje, já como uma Startup, o principal objetivo é ser capaz de prever casos das doenças mais fatais, como o câncer, e para ser competente na construção de seus modelos, a Blue se preocupa também na integração de diferentes bases, afim de amenizar o problema de interoperabilidade dos sistemas de saúde. Para saber mais: https://scet.berkeley.edu/brazil-startup-semester-students-ready-to-shake-healthcare-industry/

    32
  • Machine Learning Meetup: Special PAPIs

    Nubank's HQ

    As sponsor of PAPIs, we will host a pre-PAPIs Meetup at Nubank to get into the spirit of the event. We will have 2 presentations like usual. ======================================================================= 1ª: How AI is changing Education worldwide"? ======================================================================= Dados gerados por meio do monitoramento diário de alunos e professores, tanto em ambientes tradicionais de aprendizagem quanto em e-learning, podem ser utilizados para se projetar melhorias relacionadas à educação, como a melhor recomendação de materiais didáticos, criação de planos de estudo personalizados e até gerar previsões sobre o desempenho dos alunos, por exemplo, evitando a evasão dos estudantes. Todas essas tarefas foram atacadas por algoritmos de Aprendizado de Máquina de última geração. Nesta apresentação, teremos uma experiência imersiva com alguns desses projetos e algoritmos, de modo que possamos visualizar o que vem a seguir. Ahirton Lopes Bio: Data Scientist na Magna Sistemas, atuando na Secretaria de Educação do Estado de São Paulo, e professor de MBA nos cursos de Artificial Intelligence and Machine Learning, Engenharia de Dados dentre outros na FIAP, bem como community manager na AI Brasil e professor voluntário na School of AI SP. Apaixonado por psicologia e inovação em geral, possui mestrado em Engenharia Elétrica pela Universidade Presbiteriana Mackenzie (UPM) e é doutorando em Engenharia Elétrica e Computação na mesma instituição. Seus projetos tiveram como temas principais: Algoritmos para Predição quanto a Evasão Escolar, Auto Organização e Funcionamento Autônomo de VANTs, Processamento de Linguagem Natural dentre outros tópicos. ======================================================================= 2ª: Building your chatbot using Retrieval-based models ======================================================================= Nesta palestra vou falar sobre as dificuldades e as soluções que eu encontrei criando um dataset para montar um chatbot, e por fim, mostrar quais são as possibilidades de uso desse dataset para a construção da inteligência do seu bot usando Retrieval-based models ou até como usar as mesmas técnicas de modelos generativos para isso. Bio: Barbara Barbosa é mestra em Sistemas de Informação com foco em Inteligência computacional pela Universidade de São Paulo e Team Leader da equipe de cientista de dados na Creditas. É organizadora do Rails Girls, Women Dev Summit e Women in Data Science SP 2019, eventos voltados para mulheres que desejam aprender mais sobre tecnologia. Apaixonada por processamento de linguagem natural, correlações curiosas de dados, gatinhos e comer frutas exóticas.

    7
  • Machine Learning Meetup #33

    Nubank's HQ

    A primeira talk será em inglês e não teremos tradução simultânea! As outras duas serão em português. == Atenção == Vamos gerar imagens para um vídeo promocional sobre o evento, portanto, ao inscrever-se nele você deve concordar que a sua imagem poderá estar presente neste vídeo. ======================================================================= 1ª: Data modeling e o papel do Data Analyst no Nubank ======================================================================= Nesta apresentação vamos explicar por que data modeling no Nubank pode ser considerado um "stovepipe system" e como o time de Data Analysts foi criado para resolver esse problema. Nos aprofundaremos também nos principais papeis, desafios e impacto de um Data Analyst no Nubank. Observação: Essa apresentação será feita em inglês. Talita Angelo: Data Analyst no Nubank desde 2018, Talita faz parte do time de Data Access, que cuida do acesso aos dados do ambiente analítico da empresa. É também Mentora da plataforma de aprendizado online Udacity e faz parte do projeto Minas Programa, que visa incentivas a participação de mulheres na tecnologia. Pepijn Looije: Software Developer at Nubank since 2016. Moved from teams that build and maintain ETL pipelines towards focusing on improving the interface between Nubank's data and the people/processes that depend on them. ======================================================================= 2ª: Machine Learning e o Perfil de Risco-Retorno de Empresas Fechadas ======================================================================= A construção de carteiras ótimas a la Markowitz de ações de empresas abertas (i.e., negociadas na Bolsa) é uma tarefa conhecida e rotineira. Já fazer o mesmo para carteiras de empresas privadas constitui um desafio, dada a ausência de históricos de preços diários. Aplicamos modelos de machine learning a séries históricas de dados contábeis para estimar métricas de risco-retorno -- especificamente, retornos esperados em excesso, volatilidade e covariância (de pares) de preços -- de empresas privadas, o que deve permitir a construção da fronteira eficiente de Markowitz, e portanto de portfólios otimizados de companhias fechadas. Obtemos 𝑅2s fora da amostra em torno de 45%, enquanto regressões lineares OLS produzem 𝑅2s de apenas cerca de 10%. Flaio Abdenur: Doutor em Matemática pelo IMPA e economista pela PUC-Rio com certificado CGA da Anbima, Flavio é o fundador da SLQ Soluções Quantitativas, uma consultoria voltada para data science e machine learning aplicados a finanças, previsão e risco. Anteriormente foi analista de risco senior de um grande fundo de investimento multimercado, analista quantitativo de uma gestora fintech e professor do departamento de matemática da PUC-Rio.

    15
  • Machine Learning Meetup #32

    Nubank's HQ

    A primeira talk será em inglês e não teremos tradução simultânea! ======================================================================= 1ª: Behavioural Lookalike Model for App Advertising ======================================================================= In this talk we'll walk the audience through some of the challenges of the Real Time Bidding Protocol and it's Open Market from a Demand Side Platform perspective. We will explain some of the predictive systems we have developed in the past to overcame this challenges and its insufficiencies. In addition, we'll present a solution based on a lookalike model heavily customised for the needs of our business, alongside case studies based on our proof of concept. Javi (Javier Mermet) UBA Student - Software Engineering LABDAC member Data Scientist @ Jampp since Oct 2018 Quino (Carlos Quinodoz-Pinat) UNR - International Relations BA, International Economy MS. Product Manager @ Jampp since Sep 2014 ======================================================================= 2ª: Soon ======================================================================= Soon

    22
  • Machine Learning Meetup: Special Fklearn Open Source

    Recentemente, o time de Data Science do Nubank abriu uma de suas ferramentas para o desenvolvimento de modelos com Machine Learning, o fklearn: https://github.com/nubank/fklearn Fizemos um post no tech blog do Nubank falando sobre ela (https://medium.com/building-nubank/introducing-fklearn-nubanks-machine-learning-library-part-i-2a1c781035d0) e decidimos dedicar uma edição do meet-up para falar sobre o processo de criação, uso e open source do projeto! ======================================================================= 1ª: Fklearn: Por que criar nossa própria biblioteca de machine learning? ======================================================================= Vamos discutir alguns dos problemas encontrados pelo Nubank na aplicação de machine learning a problemas reais, e a motivação da criação do fklearn. Falaremos sobre os principais conceitos da biblioteca e das escolhas de design que fizemos, dando exemplos de problemas práticos que elas ajudam a solucionar. Lucas Estevam é Data Scientist no Nubank desde 2016, onde trabalha com modelos de crédito e foi um dos idealizadores do fklearn. É formado em Engenharia da Computação pela Poli e possui mestrado em Pesquisa Operacional pela Columbia University ======================================================================= 2ª: Demo de como usar a biblioteca ======================================================================= Nessa apresentação faremos uma demo de como usar o Fklearn, recentemente aberta para a comunidade de Data Science. Iremos demonstrar como utilizar a biblioteca em uma aplicacão prática e quais as vantagens da nossa biblioteca em relação a outras bibliotecas open-source comumente utilizadas. Iniciaremos com um exemplo básico de como treinar um modelo usando nossa biblioteca e avançaremos por funcionalidades mais avançadas, buscando explicar como essas funcionalidades agregam e facilitam as análises de um modelo de Machine Learning. Henrique Lopes é Machine Learning Engineer no Nubank desdes Março de 2018. Anteriormente trabalhou como Engenheiro de Software e Data Scientist em outra fintech, a Stone Pagamentos. Formado em Engenharia Eletrônica com especialização em Ciência da Computação, fez também um intercâmbio na Universidade de Surrey (UK) onde se aprofundou na área de Machine Learning. No nubank, Henrique trabalha no time de Crédito atuando em todo processo de dados relacionado a modelos de crédito, desde a organização de dados, passando pela criação de modelos preditivos e finalizando com o deploy e monitoramento do modelos. ======================================================================= 3ª: Queremos transformar nosso projeto em Open Source, e agora? ======================================================================= Nessa talk contamos sobre o processo de transformar uma ferramenta interna, em um projeto open source. A ideia aqui é compartilhar as experiências que tivemos, e decisões que tomamos durante esse processo, e quem sabe motivar outros times a transformar seus projetos em software aberto também. Caique Lima é Machine Learning Engineer no Nubank desde 2018, trabalha no time de Data Science Productivity desenvolvendo diversas ferramentas para o time de Data Science, que auxliam no deploy, treino e monitoramento dos modelos preditivos. Anteriormente trabalhou na Easy Taxi como Data Engineer.

    22
  • ML Meetup: Women in Data Science, McKinsey + Nubank

    R. Prof. Atílio Innocenti, 165

    Este meetup será um evento exclusivo para mulheres! ***Atenção***: o evento não será realizado no Nubank. Verifique o endereço antes de confirmar. Esta edição do meetup será especial! Teremos o nosso primeiro evento para mulheres em Data Science. Para apoiar esta grande inicitaiva, o meetup será em parceria com a McKinsey. Inscrições: 23/04 ao meio dia. Encerramento das inscrições: 24/04 ao meio dia. A lista de espera não roda depois desse horário, então quem não puder ir precisa liberar a vaga antes! ======================================================================= 1ª: Uma breve discussão sobre vieses inconscientes, liderança e propósito ======================================================================= O que são vieses inconscientes? Uma introdução sobre o tema e uma breve discussão sobre Liderança Feminina, focado em gerar uma reflexão sobre quais são nossos valores e maiores propósitos, conectando em como podemos usá-los no nosso dia a dia, seja na vida profissional ou pessoal. Milena Mariano, atualmente Associate Design Director na McKinsey, é graduada em Design pelo Senac e possui uma especialização pela Pearson College – UK. Possui cerca de 8 anos de experiência em User Experience Design (Service Design, Usability Analysis e Information Architecture). Antes de se juntar à McKinsey trabalhou como Interaction Design Consultant na Fjord (Accenture Group), também atuou como UX Designer na Web Motors (Santander Group). Também trabalhou como Usability Analyst na Try (WPP Group). ======================================================================= 2ª: Otimização da localização de canais de vendas ======================================================================= Nesta palestra mostraremos como combinamos um pipeline de machine learning e geospatial analytics em Python para definir a localização de filiais de uma Seguradora no Brasil, com o objetivo de prever o mercado de seguros em 5 anos e usar esse resultado para abrir filiais em clusters de municípios com alto valor potencial de mercado. Yanna Cavalcanti é cientista de dados na McKinsey & Company, baseada no escritório de São Paulo. Ela possui graduação em Engenharia Elétrica pela UFRN e Engenharia Eletrônica pela ENSEEIHT (Toulouse, França). Também possui doutorado na área de otimização e estatística aplicadas a processamento de sinais e imagens pelo Institut National Polytechnique de Toulouse. Na McKinsey, Yanna tem trabalhado com projetos de manutenção preditiva, previsão de demanda, otimização de produção, dentre outros. Seus principais interesses incluem otimização matemática, extração de features (em dados não-estruturados), visão computacional, reconhecimento de padrões e previsão em séries temporais ======================================================================= 3ª: Automatizando o atendimento ao cliente ======================================================================= Como garantir a escalabilidade do Nubank e ainda assim preservar nosso invejado atendimento ao cliente? Essa tem sido uma de nossas principais preocupações em Customer Support e aqui vamos mostrar como temos resolvido por meio de auto-respostas para o canal de chat. Chegamos na marca de um quarto de nossos chats sendo prontamente respondidos por um modelo, ainda mantendo nosso nível de satisfação. E ainda há espaço para muito mais! Bruna Alves, formanda em Engenharia de Computação pelo IME (RJ), é Machine Learning Engineer no Nubank desde junho de 2018. Trabalha no time de Customer Support, buscando aprimorar nossos modelos de roteamento e auto-resposta de chats. ======================================================================= 4ª: Painel ======================================================================= Faremos um painel com as palestrantes e outras cientistas de dados para respondermos perguntas sobre nossos projetos, dia-a-dia e carreira como data scientist.

    38
  • Machine Learning Meet-up Off-Road #5: BCG Gamma + Nubank

    1ª: BCG Serão apresentados dois cases de aplicação Machine Learning em conjunto com técnicas de otimização. O primeiro case é na indústria de aviação, no qual foi utilizado ML para melhorar predição de atraso no nível vôo e técnicas de otimização para redesenhar o planejamento de aeronaves muito próximo ao dia da operação. O segundo na indústria de aço, no qual usou-se ML para prever condição da produção do aço tendo como variáveis os diversos parâmetros de máquina ao longo da cadeia de produção. Também agregou-se otimização para otimizar scheduling de ordens de produção. -- David Bertoldi é Data Scientist no BCG GAMMA em São Paulo. No BCG, o David teve experiência relevante em clientes Bens Industriais e Varejo, onde tem ele aplicado Machine Learning e Otimização avançada para criar soluções holísticas para problemas. David possui um mestrado em Métodos Quantitativos pela Columbia University e é formado em Administração pelo Insper. Tadeu Rocha é Senior Data Scientist no BCG GAMMA. Os tópicos mais relevantes de seu trabalho incluem projetos em Óleo e Gás, bens Industriais, Serviços Financeiros, cobrindo diversos tópicos como analytics, operações, growth strategy e change management. Ao longo do último ano, Tadeu tem apoiado grandes clientes em suas transformações em Analytics nas indústrias de Varejo, Petroquímicos e Aviação. Tadeu se formou em Engenharia Química pela Unicamp e tem um MBA do MIT, período o qual trabalhou com empresas como GE Transportation, aplicando Machine Learning em problemas reais de negócios. Caio Guimarães é Project Leader no BCG GAMMA Os tópicos relevantes de seu trabalho incluem projetos em Empresas Aéreas, Óleo e Gás, Petroquímicos, Varejo e Mineração, cobrindo temas como operações, analytics, growth strategy e change management. Além do BCG, Caio já trabalhou no Monitor Group e Advent International. Ele é formado em Engenharia Aeronáutica no ITA, com uma extensão em Engenharia Aeroespacial pelo Institut Supérieur de l'Aéronautique et de l'Espace (ISAE), na França. Caio possui um MBA de Wharton, com foco em Business Analytics e Marketing & Operations, além de um Mestrado em Estudos Internacionais do Lauder Institute na UPenn. Alexandre Montoro é Principal no BCG São Paulo. Ele é membro do hub do BCG GAMMA no Brasil, dando suporte ao desenvolvimento dos esforços de Advanced Analytics na região. Antes do BCG, o Alexandre trabalhou na McKinsey & Company e na Oliver Wyman, focando em temas de Advanced Analytics. Ele é formado em Engenharia Elétrica da Poli-USP, e um MBA de Berkeley-Haas. Henrique Sinatura é Sócio e Managing Director do BCG GAMMA. Ele lidera os esforços de Advanced Analytics e AI no Brasil e foi responsável por estruturar o hub o BCG GAMMA no país. Os tópicos relevantes de seu trabalho incluem projetos em Óleo e Gás, Bens Industriais, Serviços Financeiros, cobrindo uma ampla variedade de temas de negócios desde Corporate Developement até Analytics e Operations. Antes do BCG, o Henrique trabalhou na Votorantim Asset Management e no JP Morgan. Ele se formou em Engenharia de Produção pela Poli-USP e possui um MBA de Harvard Business School, onde se formou com honors. =========== 2ª: Nubank O Nubank com frequência aparece na lista de empresas com melhor atendimento. Tornar o atendimento mais eficiente sem comprometer a qualidade é um dos desafios enfrentados pela nossa área de operações. Nessa apresentação falaremos de uma abordagem para auto resposta de chats e emails, usando um modelo híbrido com técnicas de processamento de linguagens e dados contextuais dos clientes. Gabriel Bakiewicz é Data Scientist no Nubank. Formado em Engenharia Elétrica na Poli-USP e com mestrado em Ciências da Computação na Northeastern University, atuou mais de 8 anos como engenheiro de software, desenvolvendo soluções críticas nas áreas de telecom e defesa. Nos últimos anos mudou seu foco para resolver problemas com aprendizado de máquina, com especial interesse por aplicações de NLP.

    37
  • Machine Learning Meetup #30 - Startups

    Nubank's HQ

    Atenção, o meetup será realizado novamente no auditório do Nubank, que fica próximo ao Café (no hall de entrada do prédio). Nesta edição do meet-up teremos apenas startups! ======================================================================= 1ª: MVISIA: Visão computacional na agroindústria ======================================================================= A MVISIA é uma startup que desenvolve soluções de visão computacional para problemas da indústria, com enfoque na agroindústria. Desenvolvemos nosso produto ESOS (Embedded Supervisory Optical System), uma câmera inteligente que utiliza técnicas baseadas tanto em visão computacional clássica quanto em redes neurais convolucionais modernas para entregar valor a clientes por meio de atuação mecatrônica em linhas de produção e colheita de dados para analytics. Na palestra apresentaremos nosso produto e discutiremos algumas das técnicas de Deep Learning que utilizamos e quais desafios e problemas que enfrentamos ao utilizá-las. -- Lucas Ribeiro é desenvolvedor de IAs para sistemas embarcados na MVISIA e graduando em Engenharia Elétrica na Escola Politécnica da USP ======================================================================= 2ª: Fhinck: Process Mining for Automation ======================================================================= Using event log generated from Fhinck software, we can assess how activities are actually carried out in a company, and from that, point out the best ones suited for automation. -- Production Engineer gone Data Scientist, just the usual story: girl loves optimization, tries it on big companies manufacturing plants, join a startup and realizes she should be doing even crazier shit with data. Halfway through my Masters of Information and Data Science degree at UC Berkeley, I am constantly provoking myself to get better and better insights from data, learning how to play with cooler and more powerful toys. ======================================================================= 3ª: Retina Vision ======================================================================= Retina Vision faz monitoramente de veículos roubados usando dumb cameras e as transformando em smart cameras, usando técnicas de visão computacional embarcados em arquitetura ARM de baixo desempenho computacional. -- Paulo é Físico, CTO e CoFounder da Retina Vision, Startup investida pela Porto Seguro e Plug & Play. Fazemos monitoramente de veículos roubados usando dumb cameras e as transformando em smart cameras. Antes de começar a brincar com câmeras e algoritmos de visão computacional, foi cientista de dados no Enjoei e fazia o sistema de recomendações de produtos bacanas. Trabalhou na Startup Mira Educação e foi responsável pelo desenvolvimento do OMR (Optical Mark Recognition) para ler os gabaritos de provas marcados com bolinhas à caneta (que todos erramos) e disponibilizar no smartphone de professores para todo Brasil, e facilitar o dia-a-dia. Guilherme é estudante de engenharia elétrica na USP e Co-Founder da Retina, startup investida pela Porto Seguro e Plug & Play. Fazemos monitoramento de veículos roubados usando dumb cameras e as transformando em smart cameras. Visão Computacional e processamento de sinais são sua paixão. Além da tecnologia embarcada nas câmeras da Retina, Guilherme já trabalhou em alguns projetos com impacto na universidade, como um contador de células cancerígenas em lâminas de tecido usando visão computacional, e também projetos extracurriculares, como a criação de drones para salvamento em alto mar (em parceria com as universidades de Stanford - Estados Unidos e Linköping - Suécia). Seus hobbies são jogar jogos de tabuleiro e apreciar cervejas artesanais.

    36