Name: Renforcement et raisonnement : Atelier sur les modèles de langage (LLMs)
Start: 2025-02-13T19:00:00+01:00
End: 2025-02-13T21:00:00+01:00

Cette session Meetup explore l'algorithme **GRPO** (**Group Relative Policy Optimization)** développé par **DeepSeek**. Au programme pour cette session :

* **Introduction à DeepSeek et GRPO :** Présentation de DeepSeek, pionnier en intelligence artificielle, et de son algorithme GRPO, conçu pour améliorer le raisonnement des modèles de langage via l'optimisation des politiques d'apprentissage par renforcement.
* **Exploration via un notebook :** permettant des démonstrations pratiques pour comprendre comment GRPO est implémenté pour entraîner des modèles de langage orientés vers le raisonnement.
* **Discussions interactives :** Échanges pour des applications potentielles de GRPO au-delà des mathématiques, en envisageant des cas d'utilisation variés et innovants.

Que vous soyez chercheur, praticien ou simplement curieux des dernières avancées en IA, votre participation enrichira nos discussions !

royam0820

Fastai - FR - Practical Deep Learning - Groupe d'Etude

Technology

Artificial Intelligence

Machine Intelligence

Machine Learning

Predictive Analytics

Neural Networks

Data Science

Deep Learning

Machine Learning with Python

Renforcement et raisonnement : Atelier sur les modèles de langage (LLMs)

Online event

Share this event

Renforcement et raisonnement : Atelier sur les modèles de langage (LLMs)

Details