A modern AI modellek (pl. nyelvi modellek) fő építőelemei:
1. Neurális hálózat
Egy matematikai struktúra, amely:
„neuronszerű” csomópontokból áll
rétegekbe szervezett
minden kapcsolatnak van egy súlya (weight)
2. Transformer architektúra
A mai nagy nyelvi modellek alapja:
figyelmi mechanizmust használ (attention)
képes hosszú szövegkörnyezetet kezelni
👉 Ilyen architektúrára épül például az Transformer (deep learning architecture).