• papis.io Latam 2019

    Informar localização

    *** INFORMAÇÃO IMPORTANTE*** Este evento é somente para divulgação do PAPIs LATAM 2019. A comunidade PyData Sâo Paulo é Community Partner do PAPIs Latam 2019 e todos os nossos membros tem direito a 30% de desconto na inscrição utilizando o link abaixo: https://papislatam2019.eventbrite.com?discount=CommunityPartner Saiba mais em: www.papis.io/latam-2019

    2
  • Data wrangling e carro autônomo

    Amazon Web Services

    PyData São Paulo Junho de 2019 Detalhes sobre o local: A recepção do evento será no 18º andar. Segue a programação do dia: # Palestra 1: Data wrangling on the cloud Discussão e exposição de estratégias para movimentar e transformar dados de diferentes formatos e tamanhos em um ambiente dinâmico de Cloud. Serão abordadas tecnologias como Apache Spark, Apache Arrow, Amazon EMR, AWS Glue e AWS Data Wrangler. # Igor Tavares - AWS Engenheiro de Computação atuando com Arquitetura de Dados! —————————————————— # Palestra 2: Como construí meu próprio Carro Autônomo (de controle remoto) Como construir um carro de controle remoto autônomo usando raspberry pi + Python + machine learning # Rodrigo Cava - Uber Cientista de Dados e Maker atualmente trabalhando na Uber como Gerente da área de Projetos de Restaurantes no Uber Eats. Formado em Computação, já trabalhou como desenvolvedor, consultor, vendedor e até design em empresas como Accenture e SAP.

    7
  • ML-Ops com Apache Marvin e Data Storytelling

    Dafiti Group

    ## Palestra 1 ### Apache Marvin: Uma ferramenta Open Source de ML-Ops Uma das maiores dificuldades em fornecer soluções usando aprendizado de máquina é disponibilizar o modelo em produção. Além de criar um modelo de qualidade, muitas vezes precisamos realizar previsões em tempo real e em grande escala. Nesta palestra, falaremos sobre o uso do Apache Marvin para criar um classificador de produto e servi-lo em uma API preditiva. ### Zhang Yifei - B2W Digital Engenheiro de dados na B2W Digital, membro PMC(Project Management Committee) do Apache Marvin. Mestre de ciência em Computação pela USP. Atualmente trabalha na área de People Analytics. ------------------------------------------------------------------------------------------- ## Palestra 2 ### Como comunicar seus dados de forma clara e eficiente: Apresentação de boas práticas em visualização de dados e storytelling, com dicas sobre como comunicar dados de forma clara e eficiente, pensando não somente no projeto a ser apresentado, mas, principalmente, no público alvo. ### Mariana Brutschin Pereira - iFood Graduação em Biotecnologia, Mestrado em Biologia Celular e Molecular, atualmente atua como Analista de dados Senior na área de Logística do iFood. Já teve experiência também como Analistade BI na Cadastra, e Lendico.

    2
  • Computação paralela em grande escala e reprodutibilidade em Machine Learning.

    Vamos falar sobre Python e dados em novo local, na In Loco! :D ## Palestra 1: Processamento de dados distribuídos usando Dask Escalando Python para data analysis de milhões à bilhões de rows. Superando as limitações do Pandas para datasets de alto volume usando computação distribuída com a biblioteca Dask. Palestrante: Rafael Moraes Senior SRE/Software Engineer na In Loco, entusiasta sobre sistema distribuídos e escaláveis. ## Palestra 2: Reprodutibilidade em Projetos de ML - O que é e por que queremos reprodutibilidade? - Compartilhando código - Experimentação contínua - Compartilhando dados Palestrante: Victor Villas Bôas Chaves Engenheiro de Dados na Gupy, o ATS líder no Brasil. Contribuidor de ferramentas Open Source voltadas pra ciência e engenharia de dados como Pandas e Apache Airflow.

    18
  • Machine Learning e Séries Temporais - teoria e prática

    Vamos falar sobre séries temporais ## Palestra 1 ### Machine-Translation Aplicada a Previsao de Series de Vendas A palestra explica a intuição dos auto-encoders e auto-encoders-variacionais em diferentes aplicações. Esses tipos de modelos são introduzidos no contexto de machine translation, text completion e speech to text. Em seguida a palestra conecta esse tipo de problema (inicialmente do domínio de NLP) com o problema geral de previsão de séries temporais. Em seguida apresenta-se um snippet de código com um passo a passo de como montar um auto-encoder com redes neurais recorrentes utilizando o pacote Keras. Por fim apresentam-se alguns resultados visuais de previsões. O objetivo da palestra é apresentar os conceitos envolvidos e a aplicação de um tipo de técnica de uma domínio (NLP) em outro (Time Series). ### Luiz Andrade **TEVEC Systems** Engenheiro Civil pela Escola Politécnica de São Paulo, Mestre em Eng de Sistemas Logísticos, MBA em Globlal Supply Chain and Logístics pelo Massachussets Institute of Technology, atualmente doutorando pela Escola Politécnica de São Paulo. Luiz é sócio-fundador e COO da TEVEC Systems, empresa com foco em aplicação de IA para aumento de produtividade em cadeias de suprimento. A TEVEC atua há 8 anos no mercado entregando sistemas e soluções baseadas em IA para empresas do segmento varejista de bens de consumo. ## Palestra 2 ### Deep Troll Detector (Gemidao do Zap) detector Tired of getting caught in difficult situations after playing some Whatsapp content with a troll in it? Let's put deep learning to work for the good! Deep troll uses a deep learning model that identifies whether an audio contains the Gemidao troll (AAAWN OOOWN NHAAA AWWWWN AAAAAH). The model uses a RNN-GRU architecture, using convolutions on audio spectrograms to extract features. https://github.com/andriosr/deeptrolldetector ### Andrios **Pismo** Sou arquiteto na Pismo, uma startup de processamento de pagamentos. Trabalho com dados aqui, além de outras coisas e dedico meu tempo extra à dados e ML.

    20
  • Machine Learning Operations - Machine Learning para produção.

    Vamos falar sobre melhores práticas de uso e avaliação de Machine Learning para projetos que irão para produção. ## Palestra 1 ### Quando Machine Learning encontra DevOps Os cientistas de dados e desenvolvedores de ML precisam de mais do que um notebook Jupyter para criar um modelo ML, testá-lo, colocá-lo em produção e integrá-lo a um portal e / ou a um aplicativo web / móvel básico de maneira confiável e flexível. Existem duas questões básicas que você deve considerar quando começar a desenvolver um modelo ML para um Business Case real: 1) Quanto tempo levaria sua organização para implantar uma alteração que envolvesse uma única linha de código? 2) Você pode fazer isso de forma confiável e repetível? ### Samir Araujo **Amazon Web Services** Samir Araújo é arquiteto de soluções de IA na AWS. Ele ajuda os clientes a criar soluções de inteligência artificial para resolver seus desafios de negócios, usando a plataforma da AWS. Ele tem trabalhado em vários projetos de IA relacionados à Visão Computacional, Processamento de Linguagem Natural, Inferência, etc. Ele gosta de brincar com projetos de hardware / programação em seu tempo livre e tem um interesse particular pela robótica. ## Palestra 2 ### Deep Learning com Reprodutiblidade Com modelos de deep learning, é comum se desprender do rigor científico e não seguir boas práticas, tornando mais difícil determinar quais componentes melhorar, adicionar ou remover; além dos naturais fatores de aleatoriedade envolvidos na modelagem. Nessa talk abordaremos formas de reduzir a aleatoriedade, como melhorar a reprodutibilidade em notebooks e como monitorar performance e resultado de modelos; utilizando PyTorch, MLFlow dentre outros frameworks. ### Guilherme Peixoto **In Loco** Atua como Machine Learning Engineer & Researcher na In Loco. Pesquisa na interseção de processamento de linguagem natural e inteligência artificial, com passagem nos EUA na Stevens Institute of Technology e Arizona State University. Na In Loco, trabalha primariamente com criar modelos de aprendizagem capazes de gerar modelos de inteligência de comportamento baseado em dados contextualizados de geolocalização.

    23
  • Machine Learning In the Wild - Casos reais de uso de Machine Learning

    Vamos falar sobre casos reais de uso de Machine Learning e como eles são usados em empresas como a Dafiti. ## Palestra 1 ### Como estruturar projetos de Machine Learnin na Nuvem - Da exploração dos dados à Predição (from EDA to predict) Mostrar como as equipes de projeto de aprendizado de máquina podem utilizar ferramentas 100% cloud para colaborar na exploração de dados, montar o pipeline de preparação de dados e validação de dados, treinar modelos preditivos usando Google Cloud Platform e realizar predições na nuvem ### Elthon Manhas de Freitas Consultor de Inteligência Artificial da Accenture, está atuando como Cloud Data Engineer em projetos globais de Machine Learning no Google usando tecnologias 100% on cloud. Professor do MBA de Machine Learning da FIAP e de Inteligência Artificial para jogos de computador do SENAC, MSc com linha de pesquisa em IA pela USP, e um ativo contribuinte da sociedade brasileira de computação SBC com pesquisas científicas publicadas sobre processos de decisão sensível a risco - SBSI 2017 e ENIAC 2018. ## Palestra 2 ### AI use cases and culture of innovation @ dafiti A multi-presenter talk where the head of R&D department will present DfTech, the Dafiti Group technology brand and culture of innovation. Then two projects that the team is working on will be presented. image classification problem focusing on how to experiment and deploy a Tensorflow model into production. And a Casual Impact for time series problem on how to grasp the complexity of predicting and automatically deciding commercial actions, how to test and debug heavy statistical code. ### Palestrantes *Georg Buske*: 17+ years of experience in designing and running highly available and scalable IT systems. Born in Germany he lives since 2011 in Brazil. Currently working as Head of R&D at Latin America's largest e-commerce for fashion, Dafiti. *Willian Fuks*: working as a Data Scientist at Dafiti Group mainly focused in recommender systems, optimization techniques, A/B testing and search engines. Holds a Master Degree in Artificial Intelligence by Escola Politécnica da USP *Ricardo Manhães*: ex-hotel manager working on a Computer Engineer degree and Computer Science Masters, focused since 2014 in learning and applying Machine Learning to help and augment humans. Working on image understanding projects at Dafiti.

    35
  • Data Science aplicado ao negócio

    WeWork Atílio Innocenti 165

    Venha conversar com o time de Analytics da McKinsey e conhecer mais sobre como Data Science pode criar impacto em um contexto de mercado. Traremos exemplos concretos de como Python foi utilizado para reduzir inadimplência de clientes e otimizar a localização de canais de vendas ***Palestra 1: Rafael Fernandes Nesta palestra mostraremos como combinamos um pipeline de machine learning e geospatial analytics em Python para definir a localização de filiais de uma Seguradora no Brasil, com o objetivo de prever o mercado de seguros em 5 anos e usar esse resultado para abrir filiais em clusters de municípios com alto valor potencial de mercado. ***Palestra 2: Vitor Bezzan Como Python foi utilizado para criar valor na recuperação de dívidas com a utilização de Advanced Analytics e métodos de otimização para incrementar a probabilidade de pagamento utilizando os canais preferenciais de cada cliente. ***Palestrantes: * Rafael é Cientista de Dados na McKinsey & Company baseado no escritório de São Paulo. Ele tem ajudado empresas em projetos de previsão de demanda, otimização de preços, análise de rede e processamento de imagem e vídeo. Seu principal interesse de pesquisa é em Deep Learning, principalmente aplicado em problemas de visão computacional. * Vitor é Cientista de Dados na McKinsey & Company, 28 anos, físico formado pela universidade de Sao Paulo, cursando mestrado na Universidade Estadual de Campinas em Matemática aplicada e Computacional. Possui 4+ anos de experiência no Mercado financeiro, aonde trabalhou com modelagem em bancos de investimento, construindo modelos de Churn, NPTB, Risco de Mercado e de Credito. Possui preferência por Banking, Securities e Risk Analytics *** “Visando garantir uma distribuição mais igualitária entre os sexos, serão reservadas 30 (trinta) vagas na lista de espera exclusivamente para o sexo feminino”

    39
  • PyData Relâmpago - Deep Learning Applications

    LINK PARA A TRANSMISSÃO: https://www.youtube.com/watch?v=thXvnpVspx4&feature=youtu.be Este será um PyData Relâmpago e o principal objetivo, além das palestras, é testar o formato de transmissão online. Enviaremos o link assim que estiver disponível. **Título: Reconhecimento de Objetos com Câmera RGBD e Deep Learning **Palestrante:Alex Torquato Souza Carneiro Esta apresentação é parte da pesquisa de doutorado de Alex Carneiro, a qual tem foco em tecnologias assistivas para deficientes visuais. Durante a apresentação, serão mostrados os primeiros resultados de localização e reconhecimento de objetos e discutiremos as técnicas de processamento de imagens e deep learning utilizadas. O objetivo desta parte da pesquisa consiste em reconhecer os elementos do ambiente e determinar suas localizações no espaço tridimensional. Para tanto, utilizamos a imagem de profundidade para a localização dos objetos e a imagem RGB como entrada para uma rede neural convolucional previamente treinada para o reconhecimento. **Título: Q&A system para o Summer Internship da Udacity **Palestrante: Ricardo Manhães Savii A Udacity possui milhares de alunos e interessados e a equipe de trabalho é bem enxuta para realizar todo o atendimento. O foco do projeto é processar o histórico de e-mails da empresa e explorar possíveis automatizações para dar suporte à equipe de atendimento. Desde uma tentativa de chatbot com a base de própria da Udacity, até analisadores e classificadores dos e-mails. **Sobre os palestrantes**: * Alex Torquato Souza Carneiro: Possui graduação e mestrado em Engenharia de Teleinformática pela Universidade Federal do Ceará (UFC), passagem pelas empresas IBM Brasil e LG Electronics do Brasil como engenheiro de software, trabalhando com sistemas de bancos de dados e tecnologias para dispositivos móveis, e pelas startups CargoX e IDwall, desenvolvendo sistemas de processamento de dados e imagens. Atualmente, permanece na IDwall, é docente no curso de Ciência da Computação na Universidade Ibirapuera (UNIB) e doutorando em Ciência da Computação na Universidade de São Paulo (USP). Utiliza a linguagem Python deste 2007 em projetos acadêmicos e nas startups. * Ricardo Manhães Savii: Ex-gerente de hotel com hobby de análise de dados e viciado em planilhas de excel, que guinou sua vida para estudar, pesquisar e aplicar mineração de dados e aprendizado de máquina. Atualmente é Bacharel em Ciência e Tecnologia, estudante de Engenharia de Computação e de Mestrado em Ciência da Computação no ICT-UNIFESP. Formado nos programas Nanodegree de Machine Learning e Deep Learning da Udacity.

    5
  • PyData - Data Discovery

    Espaço Original Faria Lima

    atenção :após as 19:00 entrar pela rua Grécia 530. Quando adquirir um veículo usado e minimizar nosso prejuízo? Adquirir um veículo, seja novo ou usado, é uma enorme despesa. A partir do momento que adquirimos este bem, ele vai desvalorizar. Quero descobrir qual o melhor momento para adquirir um veículo usado e perder o mínimo quando eu eventualmente revendê-lo. A Fundação Instituto de Pesquisas Econômicas (FIPE) mantém uma série temporal de valores médios de revenda de todos os modelos de veículos comercializados. No site da FIPE podemos consultar as tabelas de valores desde janeiro de 2001 até hoje. Minha análise focará nos preços de carros. A tabela mais recente, possui o registro do preço médio de quase 23 mil veículos dentre as 87 marcas. Desenvolvi um robô para carregar os valores de todos os registros da tabela FIPE e fiz a análise desta série temporal para responder a pergunta inicial. A apresentação focará em resultados com algumas pitadas de exemplos de códigos. Mini-bio: Sebastian é físico e doutor em oceanografia física. Tem experiência com desenvolvimento; processamento de imagens de sensoriamento remoto por satélite; modelagem numérica e sistemas dinâmicos; aprendizagem de máquina; e GIS. Descobrindo relações políticas através de doações Neste bate-papo, vamos entender como dados públicos podem tornar qualquer indivíduo em um protagonista no desenvolvimento do nosso país. Para provocar reflexões, irei mostrar como usei algumas bases de dados públicas para descobrir a rede de relacionamento entre políticos formada pelas doações em comum. As doações que aparecerão serão rankeadas utilizando um método de detecção de fraudes internacionalmente aceito, que revelará uma lista de empresas suspeitas. Depois de ver a lista, poderemos discutir sobre a abordagem utilizada e como podemos interpretar esses resultados. Mini-bio: Felipe Leite Antunes é Bacharel e Mestre em Física pela UFRGS e atualmente cursa o doutorado na mesma instituição. Durante esse tempo empreendeu 2x e falhou nas ambas tentativas, primeiro tentando transformar uma membrana de dessalinização de água do mar em empresa e depois tentando transformar um algoritmo de investimento em bitcoins em startup. Apesar de não ter desistido e ter uma ideia nova por semana, resolveu aprender um pouco mais sobre o mercado financeiro e foi convidado para ser Cientista de Dados no Itaú-Unibanco. Topou o desafio e hoje, entre um modelo preditivo e outro, ajuda a transformar o lugar na maior referência em ciência de dados do mundo. ** Este evento está sendo realizado em conjunto com o Banco Original. Queremos incentivar a igualdade de gênero e por isso estamos reservando 10 vagas para mulheres. Assim, mesmo que não haja mais vagas disponíveis, por favor façam a inscrição na lista de espera pois assim poderemos liberar as vagas.

    12