LLM (Veľký jazykový model)

Veľký jazykový model (LLM) je typ programu umelej inteligencie, ktorý okrem iného dokáže rozpoznávať a generovať text. LLM sú trénované na obrovských množstvách údajov – odtiaľ pochádza aj ich názov „veľké“. LLM sú postavené na strojovom učení: konkrétne na type neurónovej siete nazývanej transformátorový model.

Jednoduchšie povedané, LLM je počítačový program, ktorý bol napojený na dostatočné množstvo príkladov, aby bol schopný rozpoznávať a interpretovať ľudský jazyk alebo iné typy komplexných údajov. Mnohé LLM sú trénované na údajoch, ktoré boli zhromaždené z internetu – tisíce alebo milióny gigabajtov textu. Niektoré LLM pokračujú v prehľadávaní webu v snahe nájsť ďalší obsah aj po tom, ako boli pôvodne trénované. Kvalita vzoriek však ovplyvňuje to, ako dobre sa LLM naučia prirodzený jazyk, takže programátori LLM môžu aspoň spočiatku používať viac kurátorskú sadu údajov.

LLM používajú typ strojového učenia nazývaný hlboké učenie, aby pochopili, ako spolu fungujú znaky, slová a vety. Hlboké učenie zahŕňa pravdepodobnostnú analýzu nestruktúrovaných údajov, čo nakoniec umožňuje modelu hlbokého učenia rozpoznať rozdiely medzi jednotlivými časťami obsahu bez ľudského zásahu.

LLM sú potom ďalej trénované prostredníctvom ladenia: sú jemne vyladené alebo rýchlo vyladené na konkrétnu úlohu, ktorú od nich programátor požaduje, napríklad interpretáciu otázok a generovanie odpovedí alebo preklad textu z jedného jazyka do druhého.