Rio Big Data Meetup (Novembro 2015)

Name: Rio Big Data Meetup (Novembro 2015)
Start: 2015-11-11T19:00:00-02:00
End: 2015-11-11T22:00:00-02:00
Location: PUC-Rio, Prédio do RDC

Hosted by Raul M.

Rio Big Data Meetup

Details

Olá a todos,

Nós teremos a nossa quinta edição do Meetup no dia 11 de Novembro (quarta-feira) na PUC Rio. O evento é gratuito, aberto a comunidade mas temos um número limitado de lugares. Os interessados em participar devem se inscrever através do link: https://riobigdatameetup.typeform.com/to/hMkEjN confirmando a sua presença. Se você estiver interessado em apresentar na sessão de Open Mic envie um email com 1 slide.

Rio Big Data Meetup (Novembro 2015)

Dia/Horário: 11/11/2015 (quarta-feira), 19-22hs

Localização: PUC-Rio, Prédio do RDC, Primeiro andar

Agenda:

19:00 - 19:10: Introdução e Anúncios

19:10 - 19:30: Tratamento de dados grandes com Apache Spark

19:30 - 19:50: Boa pergunta! Que tal se eu falar sobre a diferença de um projeto de Big Data e um projeto convencional de TI?

19:50 - 20:10: Perfil do usuário em realtime, usando o ecossistema Big Data + Web Semântica

20:10 - 20:30: Open Mic (1 minuto para falar o que quiser sobre Big Data )

20:30 - 22:00: Sessão de Networking

Palestrantes:

FELIPE ALMEIDA

Título: Tratamento de dados grandes com Apache Spark.

Biografia: Graduado em Ciência da Computação, Aluno de mestrado na COPPE UFRJ.

Proposta: A minha proposta é falar sobre a minha experiência com tratamento de dados grandes com Apache Spark. Eu peguei um dataset com todas as reviews de produtos da Amazon ao longo de 18 anos e estou fazendo clusterização nele (com Spark MLLib e com Mahout). Só que antes de começar a etapa de aprendizado, tem uma etapa de limpeza, normalização, deduplicação, extração de features dos dados, etc, etc, o que por si só é uma tarefa pro Spark (ou pro Hadoop) e não tem tanta informação assim na internet sobre como fazer isso, até por que um dos componentes mais usados pela gente (SparkSQL) é bem recente.

O objetivo desse tratamento de dados é para podermos rodar um algoritmo distribuído de clusterização, mas acho que a etapa de pré-processamento é bem interessante também e acho que muita gente pode se interessar.

Thoran Rodrigues

Proposta: Boa pergunta! Que tal se eu falar sobre a diferença de um projeto de Big Data e um projeto convencional de TI?

Biografia: Graduado em Engenharia de Computação e com um Mestrado em Informática pela PUC-RJ (na época em que Big Data ainda se chamava "information retrieval"), Thoran Rodrigues tem mais de 15 anos de experiência no mercado de tecnologia, já tendo trabalhado de laboratórios de universidade a consultorias. Em 2011 ele fundou a BigData Corp., aonde tem atuado como CEO (dentre outras coisas) nos últimos 4 anos.

Renan Oliveira

Título: Perfil do usuário em realtime, usando o ecossistema Big Data + Web Semântica

Biografia: Desenvolvedor Full Stack na Globo.com. Integrante da área de Big Data, entusiasta de Web Semântica. Atualmente envolvido no projeto que visa facilitar o acesso as plataformas de Big Data por toda empresa.

Proposta: O Excelsior é um produto criado pelo time de Big Data da globo.com (http://globo.com/) que processa ações do usuário, como pageviews e comentários, e gera um perfil a partir anotações semânticas dos documentos da globo.com (http://globo.com/). O projeto evoluiu a partir do estudo de métricas e testes, que permitiram ter baixa latência de atualização e alta performance de entrega para milhões de usuários.

Rio Big Data Meetup

Rio Big Data Meetup (Novembro 2015)

Rio Big Data Meetup

Details

Related topics

You may also like