Big Data y consultas analíticas sub-segundo sobre terabytes de datos con Kylin


Details
Introducción al Big Data y a las consultas analíticas sub-segundo sobre terabytes de datos con Apache Kylin.
En este meetup vamos a realizar un análisis del concepto Big Data actual y tecnologías que han surgido para permitir el procesamiento de enormes conjuntos de datos, en tiempo real y procedentes de muchas fuentes, tanto internas como externas a nuestra organización. De forma práctica y mediante el análisis de un caso de uso real, mostraremos como tecnologías como Apache Hadoop y Kylin pueden mejorar aún más los procesos de toma decisiones en escenarios Big Data.
¿Quién es el ponente?
Roberto Tardío, director del área de Big Data en Stratebi y Consultor Senior en Big Data y BI, cuenta con una gran experiencia en el diseño e implantación de soluciones de Inteligencia de Negocio en escenarios Big Data. Es especialista en las tecnologías del entorno Hadoop (Hive, Kylin, Spark, Kafka, Druid), Pentaho (ETL y BI Server) y en las técnicas para el desarrollo de Data Warehouses, las cuales ha aplicado con éxito en proyectos Big Data para grandes organizaciones. Precisamente ha sido el responsable de la primera implantación de Apache Kylin en España.
¿Cuándo?
Día: 19 de septiembre de 2019
Hora: 19:00h
Lugar: Oficinas DevAcademy (Calle Núñez de Balboa 35A, Planta 5 Oficina A1)
Y... ¿de qué va a tratar la charla?
Análisis del concepto Big Data actual y tecnologías que han surgido en los últimos tiempos nos permiten el procesamiento de enormes conjuntos de datos, en tiempo real y procedentes de muchas fuentes, tanto internas como externas a nuestra organización. Gracias a estas tecnologías podemos mejorar aún más los procesos de toma decisiones y, por tanto, el rendimiento de nuestro negocio. Sin embargo, la elección del stack de tecnologías y técnicas más adecuadas para la implementación de nuestro Big Data Warehouse suele ser un problema que puede condicionar el éxito de nuestro proyecto.
Una de las tecnologías claves en las arquitecturas más potentes es Apache Kylin, la cual permite la creación de modelos analíticos multidimensionales (cubos OLAP) que permiten el análisis de datos almacenados en tablas de miles de millones de filas con tiempos de respuesta inferiores al segundo. También permite el refresco de datos near real time, en combinación con Apache Kafka. De esta forma es posible aumentar la productividad en el análisis de datos en escenarios Big Data como IoT – Smart Cities, medicina (ej. análisis genómico), redes sociales, marketing digital, etc.
El evento estará patrocinado por OVH y, además, haremos networking con unas cervecitas y un picoteo.
¡Os esperamos!

Big Data y consultas analíticas sub-segundo sobre terabytes de datos con Kylin