Big Data con chispa: explorando Apache Spark
Details
Cuando los datos crecen, las consultas se vuelven lentas, el hardware deja de ser suficiente y las aplicaciones ya no escalan… entonces aparece Apache Spark. En esta sesión descubriremos cómo llevar la potencia del procesamiento distribuido al ecosistema .NET gracias al proyecto .NET for Apache Spark, ejecutando trabajos masivos en C# con la velocidad y paralelización que hicieron famoso a Spark en el mundo del Big Data.
Exploraremos los componentes internos de Spark —Drivers, Executors, clúster, DAGs y Jobs— para entender cómo procesa datos a gran escala y por qué puede transformar tareas imposibles o lentísimas en ejecuciones eficientes y escalables. Montaremos paso a paso un clúster Spark y programaremos varios Spark Jobs en C#, viendo en vivo operaciones reales sobre grandes volúmenes de información.
IMPORTANTE: registro obligatorio para el acceso al edificio.

