Spark y el ecosistema hadoop


Details
En esta ocasión, contaremos con Chris Fregly, @cfregly (https://twitter.com/cfregly),
Principle Data Solutions Engineer @ IBM Spark Technology Center https://www.linkedin.com/in/cfregly
El meetup será en ingles casi en su totalidad, como vereis en la agenda ;).
18.30 - 19:00 Como siempre, si alguien se quiere pasar a las 18:30 y escuchar una breve introducción a la plataforma Bluemix (http://www.ibm.biz/BluemixES), @ManuAtIBM (https://twitter.com/ManuAtIBM) y @jmordax (https://twitter.com/jmordax) comentarán los basics y novedades del PaaS.
19:00 - 20:00 @cfregly (https://twitter.com/cfregly) "How Spark beat Hadoop@100TB Sort: Optimize Shuffle+Network+Netty+CPU Cache aware". Deep Dive into How Spark Beat Hadoop @ 100TB Daytona GraySort Challenge (http://sortbenchmark.org/); code-level Deep Dive into the optimizations that allowed Spark to win the Daytona GraySort Challenge.
20:00 - 20:30 @luisrei, (https://twitter.com/luisrei)Además de Spark, hay otros componentes en hadoop que también están evolucionado. Luis nos contara varios componentes no muy conocidos: text analytics, big sql y big sheets.
20:30 - 21:00 Spark as a Service @Bluemix. (http://www.ibm.biz/BluemixES)Una de las grandes novedades de este año es la posibilidad de usar el motor de analítica Spark como servicio desde la nube. Cool!!! Apache Spark Starter (https://console.ng.bluemix.net/catalog/apache-spark-starter/)
Brainstorming
Pizza y cerves para comentar entre todos la jugada...
¡Os esperamos!

Spark y el ecosistema hadoop