Scopriamo ChatGPT: Una panoramica sull'architettura di un LLM con Python

Dettagli
Scopriamo ChatGPT: Una panoramica sull'architettura di un LLM con Python
In questo intervento verranno illustrati i principi di funzionamento dell'architettura "Transformer", alla base dei moderni Large Language Models (es. ChatGPT). La descrizione teorica del funzionamento sarà accompagnata da un notebook interattivo, in modo da mostrare concretamente quello che viene spiegato. Lo scopo dell'intervento è quello di creare una maggiore consapevolezza riguardo il funzionamento di questi potenti strumenti, che stanno rivoluzionando il mondo del Natural Language Processing, in modo da riuscire ad interpretare correttamente le loro risposte. Non è richiesta alcuna conoscenza pregressa per capire gli argomenti trattati.
By Enrico Lari
Enrico e' un fisico delle particelle, appassionato di Machine Learning e Intelligenza Artificiale. Durante la sua carriera universitaria ha effettuato ricerche sull’implementazione del Deep Learning per l’elaborazione dei dati in esperimenti di fisica delle alte energie. Oggi lavora come Data Scientist e si occupa dell’automazione di processi aziendali tramite il Natural Language Processing.

Scopriamo ChatGPT: Una panoramica sull'architettura di un LLM con Python