Rio Big Data Meetup (Julho 2015)


Details
Olá a todos,
Nós teremos a nossa quarta edição do Rio Big Data Meetup dia 22 de Julho (quarta-feira) na PUC Rio. O evento é gratuito, aberto a comunidade mas temos um número limitado de lugares. Os interessados em participar devem enviar um email para riobigdatameetup@gmail.com confirmando a sua presença. Se você estiver interessado em apresentar na sessão de Open Mic envie um email com 1 slide.
Rio Big Data Meetup (Julho 2015)
Dia/Horário: 22/07/2015 (quarta-feira), 19-22hs
Localização: PUC-Rio, Prédio do RDC, Primeiro andar
Agenda:
19:00 - 19:10: Introdução e Anúncios
19:10 - 19:30: Sistema de Recomendação com Spark, problemas, arquitetura e como reduzir ainda mais o custo de processamento.
19:30 - 19:50: Teoria da Ciência e sua utilização na criação e manutenção de modelos estatísticos.
19:50 - 20:10: Data visualization for data analytics: A importância de se escolher os recursos e técnicas de visualização adequados para uma análise dos dados produtiva e efetiva.
20:10 - 20:30: Open Mic (1 minuto para falar o que quiser sobre Big Data )
20:30 - 22:00: Sessão de Networking
Palestrantes :
Felipe Cruz
Sistema de Recomendação com Spark, problemas, arquitetura e como reduzir ainda mais o custo de processamento.
Bio: Desenvolvendo software há 10 anos, passei por pequenas e grandes empresas, desenvolvendo variados tipos de software. No último período do mestrado em Ciência da Computação na PUC-Rio, com foco em Aprendizado de máquina, venho trabalhando nessa área e buscando aplicar novos métodos para o problema de recomendação.
Proposta: A idéia é explicar um pouco sobre recomendação com Spark, falar de alguns problemas práticos, um pouco de arquitetura e um novo modelo com RBMs para diminuir o custo de processamento e acelerar o fluxo completo de recomendação.
André Baceti
Teoria da Ciência e sua utilização na criação e manutenção de modelos estatísticos.
Bio: Biólogo com mestrado, terminando segunda graduação em matemática aplicada. Há um ano e meio socio fundador da Murabei Data Science, empresa focada no desesnvovimento de modelos matemáticos aplicados em diversas áreas do mercado. Atualmente responsável por modelagem e pela criação do PumpWood, uma ferramenta baseada em tecnologias open-source Python e R que busca organizar e facilitar o processo de criação e manutenção de modelos estatísticos.
Proposta: A matemática e estatística são ciências racionais puras construídas sobre cadeias de deduções tomadas sobre postulados básicos. Neste campo argumentos de necessidade são muito comuns, mas não podem ser expandidos para a análise dos dados reais.
A teoria da ciência empírica como física, biologia cria um arcabouço teórico que pode ajudar a solucionar parte dessa dicotomia entre o racional puro e o empírico. Esta palestra tem por objetivo introduzir alguns conceitos como paradigma, hipótese e experimento procurando encontrar paralelos com a atividade diária de um cientista de dados.
Por ultimo será apresentada uma solução de Data Science (PumpWood) que busca estruturar os modelos matemáticos de forma a evidenciar as relações evolutivas entres os modelos subsequentes.
Marcelo Schots
Data visualization for data analytics: A importância de se escolher os recursos e técnicas de visualização adequados para uma análise dos dados produtiva e efetiva.
Bio: Aluno de Doutorado da COPPE/UFRJ em Engenharia de Software, pesquisando e trabalhando principalmente nas áreas de Reutilização e Visualização de Software. Prestou consultoria para diversas empresas na implementação de processos de Gerência de Configuração e Gerência de Reutilização. Professor da UERJ de 2010 a 2015. Mais em http:// http://lattes.cnpq.br/8961950372465045
Proposta: Data visualization for data analytics: A importância de se escolher os recursos e técnicas de visualização adequados para uma análise dos dados produtiva e efetiva. (Nesta palestra pretendo abordar algumas características importantes a se observar quando se está construindo ou utilizando um ferramental visual para fazer análise de dados, e do impacto que isto pode causar quando se trata de Big Data. Também pretendo abordar a título de ilustração alguns frameworks voltados para isto.)

Rio Big Data Meetup (Julho 2015)