Name: DeepSeek : More Heads, Less Pain
Start: 2025-12-17T18:00:00+01:00
End: 2025-12-17T19:30:00+01:00

DeepSeek innove grâce à une architecture combinant Multi-Head Latent Attention, Mixture of Experts (MoE), et Multi-Token.

Ajoutez à cela la quantization et le GRPO.

Cette conférence décrypte ces innovations, leurs implications sur la performance et le coût, et propose une lecture critique pour ingénieurs et praticiens.

Merci de remplir ce formulaire qui m'aidera à orienter ma présentation : https://docs.google.com/forms/d/e/1FAIpQLSfvfc7J_oFWw43Frsc874L44Trx76WbYwLQgZns8VR-6ykYvg/viewform

Jackie Boscher

TensorFlow User Group Rennes - IA par le Code

Technology

Artificial Intelligence

Python

Machine Learning

Neural Networks

Artificial Intelligence Applications

Data Science

Deep Learning

Data Science using Python

TensorFlow

Deep Reinforcement Learning

PyTorch

Machine Learning with Python

Big Data

DeepSeek : More Heads, Less Pain 

Online event

Partager

TensorFlow User Group Rennes - IA par le Code

DeepSeek : More Heads, Less Pain

TensorFlow User Group Rennes - IA par le Code

Détails

Sujets connexes

Vous aimerez peut-être aussi