Aller au contenu

DeepSeek : More Heads, Less Pain

Photo de Jackie Boscher
Hosted By
Jackie B.
DeepSeek : More Heads, Less Pain

Détails

DeepSeek innove grâce à une architecture combinant Multi-Head Latent Attention, Mixture of Experts (MoE), et Multi-Token.

Ajoutez à cela la quantization et le GRPO.

Cette conférence décrypte ces innovations, leurs implications sur la performance et le coût, et propose une lecture critique pour ingénieurs et praticiens.

Photo of Meetup Machine Learning Rennes group
Meetup Machine Learning Rennes
Afficher d'autres événements
Meetup Machine Learning Rennes
Photo of Meetup Machine Learning Rennes group
Pas encore d'évaluations
Événement en ligne
Lien visible pour les participants
GRATUIT