A modern AI modellek (pl. nyelvi modellek) fő építőelemei:

1. Neurális hálózat

Egy matematikai struktúra, amely:

  • „neuronszerű” csomópontokból áll

  • rétegekbe szervezett

  • minden kapcsolatnak van egy súlya (weight)

2. Transformer architektúra

A mai nagy nyelvi modellek alapja:

  • figyelmi mechanizmust használ (attention)

  • képes hosszú szövegkörnyezetet kezelni

👉 Ilyen architektúrára épül például az Transformer (deep learning architecture).

← Vissza: AI