Alimenter ses chatbots RAG de façon industrielle et automatisée
Details
### Workshop — Alimenter la base de connaissance de ses applications Gen AI (chatbot RAG) de manière industrielle et automatisée
Les applications Gen AI de type chatbot RAG (Retrieval-Augmented Generation) reposent sur une base de connaissances riche, propre et continuellement à jour.
Mais comment collecter, transformer et indexer cette donnée de manière fiable, automatisée et scalable ?
Lors de ce workshop technique et interactif, nous apprendrons à industrialiser la mise à jour d’une base de connaissance pour un assistant IA, étape par étape, en utilisant des technologies modernes et open source.
🧩 Au programme :
🌐 Collecte & scraping de pages web (Readability / Defuddle)
🧹 Structuration du contenu en Markdown simplifié
✂️ Découpage intelligent : RecursiveTextSplitter, Semantic Splitter, Dense X Retrieval
🧠 Vectorisation : embeddings OpenAI (Ada / text-embedding-3-large)
⚙️ Orchestration automatisée avec Temporal IO pour un pipeline robuste et scalable
🔗 Mise en perspective : même use case exploré dans QaLLaM, la solution open-source du Crédit Mutuel Arkéa, basée sur les briques techniques abordées
Nous aborderons également des notions essentielles de gouvernance de la donnée, de robustesse et d’évolutivité pour les projets Gen AI modernes.
👤 Intervenant : Bernard Benjamin
💻 Prérequis : Docker et python, nodejs. Espace disque dispo ~5Go.
📌 Événement gratuit, réservé à un public technique, nombre de place limité
