Az AI nem programozott szabályokból működik, hanem tanításból (training).
1. Előtanítás (pretraining)
óriási szöveg- vagy adatállomány
cél: következő token előrejelzése
2. Finomhangolás (fine-tuning)
specifikus feladatokra optimalizálás
pl. kérdés-válasz, fordítás
3. Emberi visszacsatolás (RLHF)
emberek értékelik a válaszokat
a modell „jutalmat” kap a jobb válaszokért