Machine Learning Spain XXVII


Details
Hola, apasionados de los datos. Llega marzo y ya tenemos fecha para un nuevo meetup de ML Spain, que seá el miércoles día 14 de marzo a las 18:30h en Campus Madrid.
Esta edición es especial porque nos unimos al Grupo de usuarios de R para celebrar este encuentro que dará paso a la primavera. En estos días publicaremos la agenda definitiva, pero queríamos que os reserváseis ya la fecha.
La agenda prevista es:
18:30 - Acceso al auditorio de Campus Madrid y cerveza fresquita
19:00 Deep Learning for Cancer Immunotherapy (or no so DeepLearning), por Carlos Ortega
En la presentación se evaluará el poder predictivo de diferentes algoritmos, algunos de DeepLearning y de los ya considerados tradicionales para determinar la presencia de ciertas moléculas asociadas al cáncer. Se explorará si alguno de los modelos de DeepLearning (dense layer, CNN) realmente ofrecen ventajas sobre datos de tipo tabular. Igualmente se comparará el resultado de la implementación de Keras frente a la que ofrece H2O.
Carlos Ortega es licenciado en Ciencias Físicas, MBA, profesor en varios Másteres de BigData, R-adicto desde sus primeras versiones, coordinador del Grupo de Usuarios de R de Madrid en sus casi ya 7 años de existencia. Fijo en la lista de R-Help-es y de varios grupos de LinKedIn. De un tiempo a esta parte, muy centrado en las posibilidades del DeepLearning y de las APIs Cognitivas.
19:30 Machine Learning automatizado, por Santiago Mota
En la presentación analizaremos la situación de algunos productos que prometen hacer Machine Learning de forma automática, tomando como ejemplo la empresa H2O y dos de sus herramientas: autoML (gratuita) como algoritmo dentro de su plataforma y driverlessAI (de pago) como su apuesta de producto para que las empresas automaticen los procesos de Machine Learning.
Santiago es consultor freelance en Business Intelligence, Machine Learning y Estrategia, labor que compagina como profesor en la EOI, UNED o Universidad Complutense entre otras instituciones y como mentor.
20:00- Imputación de Datos Espacio-Temporales Reloaded, por Héctor Aguilera
Se aborda el problema de completar series temporales de datos geoespaciales con cantidades muy grandes de missing data. La variable escogida es la precipitación diaria en 112 estaciones del suroeste peninsular en el ámbito del Parque Nacional de Doñana. Disponer de series completas es fundamental para desarrollar modelos hidrológicos fiables para la planificación y la gestión. Se comparan algoritmos de tres enfoques potentes: geoestadística (kriging espacio-temporal), imputación múltiple (predictive mean matching) y machine learning (random forest). Todos ellos implementados en paquetes de R (gstat, micemd, missForest). Para evaluar los modelos se han definido tres tipos de conjuntos de train y test basados en diferentes patrones de ausencia en 10 estaciones.
Héctor Aguilera Alonso es licenciado en Ciencias Ambientales por la UAM y en Matemáticas por la UNED. Es doctor en ciencia del agua y el suelo por la UCM. Posee además un curso de posgrado en Data Science de la U-tad. Actualmente trabaja como investigador y data scientist en el Instituto Geológico y Minero de España en el área de Geomatemáticas. Su línea de investigación se centra en el análisis de datos espacio-temporales hidrológicos y ambientales relacionados con las aguas subterráneas, y la elaboración de modelos numéricos y predictivos con técnicas de machine learning de apoyo a la gestión del agua.
20:30 - ¡Cervezas y networking!
Si queréis proponer vuestras propias charlas para futuros eventos, podéis hacerlo en este cuestionario ( https://docs.google.com/forms/d/e/1FAIpQLSfKXUIz4R2aNWUP8WUrEEijidARGmvkllfgwBnfMZuUR30AKA/viewform?c=0&w=1 ) y también podéis enviarnos un mensaje por aquí. Mantendremos siempre abierto el C4P para recoger las charlas más interesantes.
La evolución del evento y algunas fotos estarán en la cuenta de Twitter @ml_spain ( https://twitter.com/ml_spain )
Nos vemos en Campus Madrid.

Machine Learning Spain XXVII