Sept 26 - Madrid AI, ML and Computer Vision Meetup


Detalles
Acompáñanos para escuchar charlas de expertos en IA, ML y Visión por Computadora.
Sep 26, 2025, 6:30 - 10:00 PM
Google For Startups Campus
C. de Moreno Nieto, 2, Arganzuela
28005, Madrid
Spain
Multimodality at Hugging Face
In this talk, we’ll explore the latest advances in multimodal AI within the Hugging Face ecosystem. From vision-language models to emerging Omni models, we’ll dive into cutting-edge architectures powering this space. We’ll also take a look at the tools and libraries Hugging Face provides to support end-to-end multimodal workflows.
Sergio Paniego Blanco is a Machine Learning Engineer at Hugging Face, primarily focused on multimodality and AI agents.
Tus Datos te Están Mintiendo: Búsqueda Semántica Para Encontrar la Verdad
Los modelos de alto rendimiento comienzan con datos de alta calidad, pero encontrar muestras ruidosas, mal etiquetadas o casos límite dentro de conjuntos de datos masivos sigue siendo un gran obstáculo. En esta sesión, exploraremos un enfoque escalable para curar y refinar conjuntos de datos visuales a gran escala utilizando búsqueda semántica impulsada por embeddings basados en transformers. Al aprovechar la búsqueda por similitud y el aprendizaje de representaciones multimodales, aprenderás a descubrir patrones ocultos, detectar inconsistencias y encontrar casos límite.
También discutiremos cómo estas técnicas pueden integrarse en lagos de datos y canalizaciones a gran escala para facilitar la depuración de modelos, la optimización de conjuntos de datos y el desarrollo de modelos fundacionales más robustos en visión por computadora. Únete a nosotros para descubrir cómo la búsqueda semántica está transformando la manera en que construimos y refinamos sistemas de inteligencia artificial.
Paula Ramos tiene un doctorado en Visión Artificial y Aprendizaje Automático, con más de 20 años de experiencia en el campo tecnológico. Desde principios de la década del 2000 en Colombia, ha desarrollado novedosas tecnologías integradas de ingeniería, principalmente en Visión Artificial, robótica y Aprendizaje Automático aplicados a la agricultura.
Agentes del Mañana: Descifrando los Enigmas de Planificación, UX y Memoria
Los agentes IA, impulsados por LLMs, prometen transformar aplicaciones. Pero, ¿son hoy simples ejecutores o futuros colaboradores inteligentes? Para alcanzar su verdadero potencial, debemos superar barreras críticas. Esta charla se adentra en los 3 enigmas que definirán la próxima generación de agentes:
1. Planificación Avanzada (El Cerebro): Los agentes actuales a menudo tropiezan con tareas complejas. Exploraremos cómo, más allá de las llamadas a funciones básicas, las arquitecturas cognitivas permiten trazar planes robustos, anticipar problemas y razonar con profundidad. ¿Cómo hacerlos "pensar" varios pasos adelante?
2: UX Revolucionaria (El Alma): La interacción con un agente no puede ser una fuente de frustración. Analizaremos cómo trascender el chat tradicional hacia interfaces "human-on-the-loop", UX colaborativas, generativas y accesibles. ¿Cómo diseñar experiencias que enganchen?
3. Memoria Persistente (El Legado): Un agente que olvida lo aprendido está condenado a la ineficiencia. Veremos técnicas para dotarlos de memoria significativa que vaya más allá del historial, permitiendo que aprendan y cada interacción sea más inteligente.
Llevaremos ideas concretas y una visión clara para contribuir a construir los agentes del mañana: más inteligentes, más intuitivos y verdaderamente capaces. ¿Te unes a la expedición para descifrar el siguiente capítulo de los agentes IA?
Máximo Fernández Núñez es ingeniero de Aprendizaje Automatico y estuve desarrollando HW y FW durante unos 7 años, hasta que descubrí la inteligencia artificial y me apasionó. Comencé a estudiar sobre IA y cambié mi rol, empecé a trabajar en proyectos de visión por computador, uno de ellos, por ejemplo, desarrollando un vehículo autónomo.
Desplegando modelos de vision eficicentes: tecnicas de cuantizacion y optimizacion
Abordamos técnicas para acelerar la inferencia en modelos de visión por computadora mediante optimización y cuantización. Se analizarán estrategias como la reducción de precisión, fusión de operaciones, poda y uso de toolkits como OpenVINO. Se presentarán benchmarks que demuestran mejoras en latencia y rendimiento, manteniendo una precisión aceptable, especialmente en despliegues edge y en tiempo real.
Hind Azegrouz AI technical sales lead para Intel en EMEA. Doctora en vision por computadodra y docente de Computer Vision en IE.

Sept 26 - Madrid AI, ML and Computer Vision Meetup