GDG #33 : Réduire la latence des Agents et des LLMs en production : Architecture
Détails
💡 Vous déployez des LLMs ou des agents en production… et la latence explose sous charge ?
🎯 Au programme : les patterns d’architecture AIOps et LLMOps pour reprendre le contrôle sur la latence :
→ caching sémantique
→ routing multi-modèles
→ streaming (SSE)
→ observabilité
→ redimensionnement du serveur
→ gestion des workers
→ évaluation continue
Agenda
---
Speaker
Kassoum Sanogo
Hosted By
Jérémy Voisin, AI Lead & Cloud Architect
Nicolas CHAMPION, GDG Organizer
Alexis Dalle, AI Consultant
Julien Lesourd, Headhunter
French enthusiast Tech Recruiter.
I love build Tech communities and smart blocks with Notion.
Edwin Simonnet, Tech Lead
Khava Ousmanova, GDG Organizer
Frédéric Vallejo, Cloud Azure Architect
---
Partners
Le Village By CA Le Mans (https://lemans.levillagebyca.com/fr/)
Le Village by CA Le Mans est une initiative de la Caisse Régionale du Crédit Agricole Anjou Maine et de la CCI Le Mans Sarthe. Il accompagne les start-ups du territoire dans leur phase d’accélération, il favorise également les échanges entre les start-ups et les grandes entreprises.
CGI (https://www.cgi.com/en)
---
Complete your event RSVP here: https://gdg.community.dev/events/details/google-gdg-le-mans-presents-gdg-33-reduire-la-latence-des-agents-et-des-llms-en-production-architecture-aiops-amp-llmops/.

