What we're about

#ODSC brings together the open source and data science communities with the goal of helping its members learn, connect and grow.

The focus of this Meetup group is to allow #ODSC to work with Meetup groups, non-profits, and other organizations to present informative lectures, workshops, code sprints and networking events to help grow the use of open source languages and tools within the data science and data-centric community. As such, our specific goals are:

1. Build a collaborative group to work with other Meetup groups, non-profits, and other organizations.

2. Promote the use of open source languages and tools amongst data scientists and others.

3. Host educational workshops.

4. Spread awareness of new open source languages and tools that can be used in data science.

5. Contribute back to the open source community.

Who is this meetup for?

• Data engineers, analysts, scientists, and other practitioners

• R, Python and other software engineers who work with data or want to learn

• Data visualization developers and designers

• Non-technical team leads, executives, and other decision makers from data centric startups and large companies looking to utilize open source tools

Get Involved with our Meetups:

• Speaker Form ( https://docs.google.com/a/odsc.com/forms/d/1trkCoecAMa8za_ZzfN5bW6ZNBaRlmqJSQvuME_2nbJA/edit?usp=drive_web ) - Submit a talk, tutorial, or panel.

• Suggest a Meetup Topic Form ( https://docs.google.com/forms/d/1rEjO3UMMXRXtY8Yr_J_jj3ebYwsIFqcGA6FZzWK4rd0/edit )

• Volunteer Form ( https://docs.google.com/forms/d/1Vu3B72avz2I1xx618pEFGsuywZE9t4n78br9vSEX9oE/edit )

• Host or Sponsor Form ( https://docs.google.com/forms/d/1eyM9hJ3l8TlNmw35re65mH7mFCmsPoRZ1p5RJQEVhnk/edit )

• Showcase your Startup Form ( https://docs.google.com/forms/d/1oz8A4fbfe6HHs71v4nMpcf9FP_kpS9CcCfd3qIBS5HU/edit )

Upcoming events (1)

Processamento de Linguagem Natural na Prática|DataOps - StreamSets e Ap. Airflow

Agenda: 19:00 - 19:30 - Networking, Food & Refreshments. 19:30 - 19:40 - Vagas.com Introduction 19:40 - 20:20 - Speaker One e Q&A 20:20 - 21:00 - Speaker Two e Q&A Speaker One: Thiago Kuma, Cientista de Dados na Vagas.com https://www.linkedin.com/in/thiago-kuma-75573930/ Topic: Processamento de Linguagem Natural na Prática, Prevendo Escrita Através de Contexto. Bio: Thiago Kuma, apaixonado por aprender, era Eng. de Software do sistema crítico de controle de tráfego aéreo e desde 2014 um Cientista de Dados na VAGAS.com. Responsável pela ML que recomenda vagas para 2,3 milhões de candidatos por dia. A partir de uma vídeo entrevista analisa reação facial, áudio e sua transcrição para indicar os melhores candidatos para o Recursos Humanos. Abstract: Existem problemas bastante interessantes quando trabalhamos com textos, por exemplo entender a diferença entre Arquiteto das áreas de Arquitetura e Software, uma forma de aplicar uma desambiguação é contextualizar e uma das soluções é usar Processamento de Linguagem Natural colocando a Semântica em jogo. Esse mesmo contexto permite também “prever” palavras que deveriam existir em um texto. Você vai aprender o básico de conceitos como Word2Vec, Topic Model, Bag of Words, LSA (Latent Semantic Analysis) / LSI (Latent Semantic Index) Você terá uma base teórica e verá uma demonstração prática de como treinar e usar um modelo para: identificar similaridades de texto utilizando Semântica e uma forma simples de identificar palavras que deveriam estar em um texto. Vagas: https://www.vagas.com.br/ Speaker Two: Mathias Brem Garcia, Head of Big Data & Analytics na SulAmérica https://www.linkedin.com/in/mathiasbremgarcia/ Topic: DataOps com StreamSets e Apache Airflow. Bio: Bacharel em Sistemas de Informação pelo SENAC e MBA em Internet Of Things pela Escola Politécnica da USP, além de possuir certificações em diversas tecnologias de armazenamento de dados pela Oracle, IBM e Cloudera. Ministra palestras em universidade e cursos oficiais da Cloudera em sua própria startup, colocar nome da start up, além de manter publicações ativas na revista Imasters sendo referência no segmento. Participou da construção de alguns dos maiores e mais complexos sistemas de Big Data & IoT do mercado e vem atuando em projetos de Big Data desde 2015 em empresas como: Itaú, Santander, Semantix, Everis, Elo, Cielo, Tivit, Locaweb, Porto Seguro, Bradesco, Next, AmBev. Trabalhando atualmente na SulAmerica Seguros como Head de Big Data & Analytics. Nas horas vagas anda de kart amadoramente, tendo sido campeão em 2016, faz cerveja artesanal, joga CS, entre outras “nerdices”. Abstract: A crescente demanda por fluxos de dados cada vez mais complexos e com sua devida criticidade uma vez em produção exigem um grande aparato e estrutura tecnológica para garantir tais controles. Será apresentado nessa palestra o manifesto do DataOps, metodologia a ser empregada em fluxos de dados bem uma apresentação prática utilizando Streamsets, Apache Airflow e Spark! ODSC Links: • Get free access to more talks like this at LearnAI: https://learnai.odsc.com/ • Facebook: https://www.facebook.com/OPENDATASCI/ • Twitter: https://twitter.com/odsc & @odsc • LinkedIn: https://www.linkedin.com/company/open-data-science/ • East Conference Apr 30 - May 3: https://odsc.com/boston

Photos (7)