2025. 06. 26. - 09:35
Önmagát képző mesterséges intelligencia-modellt hozott létre a Massachusetts-i Technológiai Intézet

Mesterséges intelligencia-modellt alkotott meg a Massachusetts-i Technológiai Intézet (MIT), amely önmagát képes képezni. A fejlesztés jelentős lépés a független MI-modellek létrehozása felé.
Önmagát képző mesterséges intelligencia-modellel állt elő a Massachusetts-i Technológiai Intézet (Massachusetts Institute of Technology - MIT).
A kutatók egy új keretrendszert fejlesztettek ki, amely lehetővé teszi a nagy nyelvi modellek (LLM-ek) számára az önképzést – ez pedig jelentős előrelépés a MI-fejlesztésben.
Régóta várt mérföldkő
Az új keretrendszer - az úgynevezett Self-Adapting Language Models, vagy SEAL - lehetővé teszi az LLM-ek számára, hogy saját képzési adatokat és oktatási frissítéseket generáljanak, s ezzel egyben folyamatosan felülvizsgálják belső rendszereiket emberi beavatkozás nélkül.
Az önfejlesztés újszerű képessége régóta várt mérföldkő a területen – jegyezte meg a kutatócsapat.
„Az LLM-ek hatékonyak, de statikusak; hiányoznak belőlük azok a mechanizmusok, amelyekkel súlyaikat az új feladatokhoz, ismeretekhez vagy példákhoz igazíthatnák” – jelezték a fejlesztésről szóló cikkben. Olvasd el: Mesterséges neurális hálózatok belső működése segít az MI megértésében

„Bemutatjuk a SEAL-t, egy olyan keretrendszert, amely megoldja az LLM-ek számára, hogy saját finomhangoló adataik és frissítési direktívák generálásával önadaptáljanak… lehetővé téve a tartós alkalmazkodást.”
Testre szabott, saját oktatási stratégia
Hagyományosan a nyelvi modellek finomhangolással vagy kontextuson belüli tanulással alkalmazkodnak az új feladatokhoz, emberek által kurált és formázott adatokra támaszkodva.
Ennek a megközelítésnek azonban vannak korlátai - a kutatók megjegyzik, hogy a rendelkezésre bocsátott adatok „nem mindig optimálisak a modell hatékony tanulásához”.
A SEAL azonban lehetővé teszi a modell számára, hogy eldöntse, hogyan tanuljon a legjobban az új információkból és testre szabja saját oktatási stratégiáját.
A kutatócsoport megerősítéses tanulást is alkalmazott a rendszer betanításához, beleértve a ReST algoritmust, amely kiértékeli és jutalmazza a leghatékonyabb „önszerkesztéseket” – a modell által generált finomhangoló irányelveket.
A tesztekben a SEAL-lal betanított modellek több feladat során is drámai mértékben felülmúlták a standard LLM-eket - például a GPT-4.1.
Egy kísérletben a rejtvénymegoldási teljesítmény 0-ról 72,5 százalékra emelkedett a modell saját, önmaga által generált tananyagának használatával.
Intelligensebb chatbotok és virtuális asszisztensek
A csapat szerint az eredmények rövid távon intelligensebb chatbotok és virtuális asszisztensek kifejlesztéséhez vezethetnek, amelyek alkalmazkodnak az egyes felhasználók preferenciáihoz és folyamatosan frissítik magukat új információkkal.
A tanulmány utat nyithat azon modelleknek is, amelyek képesek eldönteni, mikor alkalmazkodnak az új információkhoz és önállóan határozhatnak arról is, szükség van-e önszerkesztésre – vélik a kutatók.
Az ilyen fejlesztések olyan ágensalapú MI-ágensek létrehozásához vezethetnek, amelyek képesek folyamatos fejlesztésre interakció és reflexió révén.
A rendszernek ugyanakkor megvannak a korlátai. A kutatócsapat szerint a modell „katasztrofális felejtéstől” szenved, amikor régebbi feladatok és ismeretek eltűnnek az újabb bemenetek hozzáadásával.
„Ez arra utal, hogy a tudásmegőrzés explicit mechanizmusai nélkül az önmódosítás felülírhatja az értékes korábbi információkat” – jelezték a szakemberek.
Hozzátették azonban: a kihívás kezelése folyamatban van. A lehetséges megoldások közé tartozik az újrajátszás, a korlátozott frissítések vagy a reprezentációs szuperpozíció.
B.A.