2024. 11. 06. - 08:40

Nem igazán érti a generatív mesterséges intelligencia a világot?

Nem igazán érti a generatív mesterséges intelligencia a világot?

Bár a generatív mesterséges intelligencia, a nagy nyelvi modellek lenyűgöző dolgokra képesek, kutatók szerint nem teljesen értik a világot.

Lehengerlő teljesítménye ellenére a generatív mesterséges intelligencia (GMI) nem ismeri egységesen a világot – hívták fel a figyelmet a kutatók.
 
A nagy nyelvi modellek lenyűgöző dolgokat művelhetnek - például verset írhatnak vagy működőképes számítógépes programokat generálhatnak -, még akkor is, ha arra vannak tanítva, hogy megjósolják a szövegben a következő szavakat.
 
Az efféle, meglepő képességek azt a látszatot kelthetik, hogy a modellek implicit módon tanulnak meg néhány általános igazságot a világról.
 
Egy új tanulmány szerint azonban ez nem feltétlenül van így. A kutatók felfedezték, hogy a generatív mesterséges intelligencia-modell egy népszerű típusa közel tökéletes pontossággal nyújthat lépésről-lépésre vezetési útvonalat New Yorkban – anélkül, hogy pontos belső térképet készítene a városról.
 
Annak ellenére, hogy a modell elképesztően hatékonyan reagál, történt egy malőr: amikor a kutatók lezártak néhány utcát és kitérőket építettek be, a teljesítménye zuhanni kezdett.
 
Mélyebbre ásva már nem volt tökéletes a generatív MI
 
Mélyebbre ásva a témában a szakemberek rámutattak, hogy a modell által implicit módon generált New York-i térképeken számos nem létező utca kanyarodik és köt össze távoli kereszteződéseket. Olvasd el: Olyan veszélyes lett a Microsoft-féle MI, hogy félnek azt bemutatni
 
Nem igazán érti a generatív mesterséges intelligencia a világot?
Nem igazán érti a generatív mesterséges intelligencia a világot?
 
Mindez komoly következményekkel járhat a valós világban alkalmazott generatív mesterséges intelligencia modellekre nézve, mivel egy adott kontextusban jól teljesítő modell meghibásodhat, ha a feladat vagy a környezet kissé megváltozik. 
 
„Az egyik reményünk, hogy mivel az LLM-ek mindezeket a csodálatos dolgokat képesek elérni a nyelvben, ugyanezeket az eszközöket talán a tudomány más részein is használhatjuk. Nagyon fontos viszont a kérdés, hogy az LLM-ek koherens világmodelleket tanulnak-e, ha azt szeretnénk, hogy ezeket a technikákat új felfedezésekhez alkalmazzuk” – mondta el Ashesh Rambachan vezető szerző, közgazdasági adjunktus, a Massachusetts-i Technológiai Intézet (Massachusetts Institute of Technology – MIT) Laboratory for Information and Decision Systems (LIDS) laborjának vezető kutatója.
 
Rambachan együttműködik Keyon Vafával, a Harvard Egyetem posztdoktorával az ezen munkáról szóló tanulmányban.
 
Részt vesz benne Justin Y. Chen, az MIT elektromérnöki és számítástechnikai (EECS) végzős hallgatója, Jon Kleinberg, a Tisch Egyetem számítástechnikai és információtudományi professzora, a Cornell Egyetemről, valamint Sendhil Mullainathan, az MIT professzora, az EECS és a közgazdasági tanszékek munkatársa, egyben a LIDS tagja.
 
A kutatást a szakemberek a Neurális Információfeldolgozó Rendszerek Konferencián tervezik bemutatni.
 
 
B.A.

 

 

 

Hírlevél feliratkozás

Kérjük, add meg adataidat a hírlevélre történő feliratkozáshoz! A megadott adatokat bizalmasan kezeljük, azokat harmadik félnek át nem adjuk.