Crafting with AI #17
Détails
Nouvelle édition, même ADN : concret, zéro bullshit.
Au menu : 2 talks qui collent au terrain.
1) Évaluation continue d’agents IA en production (Wakam)
Déployer des agents IA en production c'est bien, mais comment s'assurer qu'ils ne régressent pas au fil du temps ? Chez Wakam, on a construit une plateforme complète d'évaluation qui combine :
- Génération automatique de datasets synthétiques via des agents IA spécialisés dans Dust
- Validation humaine par les experts métiers dans une interface dédiée via Retool
- Orchestration des évaluations via Prefect
- Monitoring continu dans Langfuse
On vous montrera notre architecture et stack (Dust.tt), Retool, Prefect, Langfuse) et comment elle résout deux pain points majeurs : l'absence d'évaluation native dans les plateformes d'agents SaaS et la complexité de maintenir des datasets à jour. Démo incluse sur notre cas d'usage RH.
Speakers: Wided Ahlem Touhami, Hamza Ben Marzouk, Ouarda Boumansour (Équipe AI Engineering, Wakam)
2) Du “large” au “small” : pourquoi les Small Language Models changent la donne
Les LLMs sont impressionnants, mais coûteux et lourds à opérer et parfois disproportionnés par rapport aux besoins réels.
Les Small Language Models proposent une alternative plus légère, adaptable dans de bonnes conditions, moins chère et beaucoup plus simple à déployer, tout en couvrant une large partie des cas d’usage opérationnels. Voyons ensemble comment et pourquoi “small” devient souvent le choix le plus pragmatique… et parfois le plus stratégique.
Speaker: Olivier Bergeret (Head of Data)
Lieu: Thiga, 23 rue Taitbout, 75009 Paris
Accueil: 18:45
Talks: 19:00 puis Q&A
Apéro: networking sur place
Places limitées. Merci à Thiga pour l’accueil.
