NuExtract : un LLM open-source pour l'extraction d’informations


Details
Les LLMs de pointe transforment le domaine de l’extraction d’informations. Pourtant, leur utilisation reste limitée par des risques de fuite de données, un coût d’inférence élevé, et des difficultés de personnalisation. Dans cette présentation, Etienne Bernard, cofondateur de NuMind nous présentera NuExtract 2.0, un modèle open-source d’extraction d’informations qui surpasse GPT-4o tout en étant des ordres de grandeur plus léger, ce qui permet sa personnalisation et son utilisation en toute confidentialité. Etienne nous expliquera comment lui et son équipe ont créé NuExtract 2.0, avec une démonstration à l’appui, et partagera les enseignements tirés de cette expérience.
En introduction de soirée, Pierre Biousse, Senior Manager chez Ekimetrics en charge des sujets d'IA Générative nous présentera comment l'IA Générative et l'Agentic permettent d'accélérer les cycles de développement produit.
⏰ Planning
- 18h45 - 19h00 : Accueil & introduction 👋
- 19h00 - 19h20 : Talk 1 - Comment l'IA Générative et l'Agentic permettent d'accélérer les cycles de développement produit.
- 19h25 - 20h10 : Talk 2 - NuExtract : un LLM open-source pour l'extraction d’informations
- 20h10 - 21h30: Cocktail & échanges 🥂
🎙 Speakers
Etienne Bernard est un entrepreneur, expert en IA et machine learning. Après un doctorat en physique statistique à l’ENS, puis un post-doctorat au MIT, Etienne a rejoint Wolfram Research, où il a dirigé le groupe Machine Learning pendant 8 ans. Il a ensuite écrit le livre “Introduction to Machine Learning” puis co-fondé NuMind, une startup IA spécialisée dans l’extraction d’information.
Pierre Biousse est Senior Manager chez Ekimetrics en charge des sujets d'IA Générative. Il développe des produits d'IA depuis plus de 7 ans dans divers secteurs : transports, finance, retail.
🙌 Sponsors et entreprises participantes
NuMind développe des modèles d’intelligence artificielle, comme NuExtract, capables de transformer des documents non structurés (texte brut, PDF, HTML, etc.) en données exploitables. Leur approche se distingue par des modèles qui surpassent les performances de ceux, plus gros, d’OpenAI et d’Anthropic, tout en étant beaucoup plus compacts. NuMind a été fondée en 2022 et toute l’équipe est basée en France.
Ekimetrics, fondée en 2006, est un leader européen de la « data science au service du business ». Sa mission est d’aider ses clients à auditer leurs opportunités liées aux données, enrichir leur capital analytique et déployer des solutions concrètes pour maximiser leur performance marketing et opérationnelle, tout en dynamisant leurs modèles économiques. Avec plus de 320 data scientists, Ekimetrics dispose de l’une des plus grandes équipes indépendantes en Europe. Ekimetrics s’attache à délivrer des gains à court terme tout en assurant le développement à long terme des actifs data de ses clients.
🤩 Audience
Cet évènement est destiné aux professionels de la data et de l'algorithmique et qui souhaitent pousser plus loin les efforts d'industrialisation dans leurs organisations : data scientists, data engineers, software et devops engineers, data project/product managers, product designers, etc.
👋 Contact
Pour toute question ou information, merci de contacter [florent@nibble.ai](http://mailto:florent@nibble.ai)


NuExtract : un LLM open-source pour l'extraction d’informations