Puntata 6: Come si allena un modello — Corso AI in 10 puntate

Nelle prime cinque puntate abbiamo costruito le fondamenta: cos’è un modello, come il testo diventa token, come i token diventano embedding, e come il Transformer usa questi embedding per capire il contesto. Ora arriva la domanda che lega tutto insieme: come fa un modello a imparare?

Questa puntata segna la fine della prima parte del corso, quella più focalizzata sui concetti fondamentali. Dopo, passeremo alle applicazioni pratiche.

Ma finora abbiamo parlato di come è fatto un modello e come rappresenta il linguaggio. Non abbiamo ancora toccato il punto cruciale: come impara tutto questo? Come fa quella complessa architettura, piena di miliardi di parametri inizialmente casuali, a diventare uno strumento che sembra “capire” e “creare”?

Il processo si chiama addestramento, o training, ed è il cuore pulsante della Machine Learning moderna. Non è come programmare un computer per seguire istruzioni precise (“se vedi una mela, dì mela”). È più simile a insegnare a un sistema, mostrandogl