Spark y la Combinación de sus Distintos Módulos


Details
http://photos4.meetupstatic.com/photos/event/c/a/9/2/600_445911858.jpeg
SPARK es el nuevo framework de moda, con el permiso de Flink, para la computación distribuida. Una de sus particularidades más conocidas es que está preparado para "todo", es decir, que a diferencia de otros frameworks de computación distribuida anteriores (Hadoop), con el mismo framework podemos atacar casuísticas de distintos tipos sin tener que recurrir a otros proyectos para solucionarlas.
Esta interesante particularidad puede suscitar algunas preguntas: ¿Un proceso de SparkSQL se puede mezclar con otro proceso lanzado con el Spark Core? ¿Puedo utilizar mis procesos hechos en Batch en un proceso hecho en Streaming? ¿Cómo aplico lo aprendido en un algoritmo de MlLib a una lógica en tiempo real? ¿Hay algo de sentido en alguna de estas preguntas? ¿Habrá cervezas al terminar?
A estas preguntas buscará respuesta JORGE LÓPEZ-MALLA con una amena charla y realizando en vivo algunas casuísticas, basadas en proyectos reales en los cuales se ha encontrado con estos dilemas.
Se reservará algo de tiempo al final de la charla para resolver dudas tanto de la propia charla, como de Spark en general (estas últimas si sobra tiempo).
**Un mínimo nivel de Spark es requerido dado que no se explicarán cómo funciona el propio framework, aunque no se realizará ninguna algoritmia compleja.

Spark y la Combinación de sus Distintos Módulos