2021. 07. 13. - 09:20
Videók alapján jósolná meg az emberi viselkedést a mesterséges intelligencia
Az ember számára természetes, hogy előre érzékeli valakinek a viselkedését a testbeszéde alapján – ám a számítógépeknek ez nem ilyen egyszerű. A mesterséges intelligencia ezt most videók alapján tanulja.
Megjósolni valakinek a viselkedését, következő lépését nem olyan nehéz az emberek számára, hiszen arra következtetni lehet testbeszédünk alapján. Lehet, hogy elsőre nem tudjuk, melyik gesztust fogjuk használni, amikor találkozunk valakivel, de a helyzetben már megfelelően reagálunk. A gépek számára ez nem ilyen könnyű.
Egy új tanulmány során a Columbia Engineering kutatói olyan számítógépes látástechnikát mutattak be, amely jóval „intuitívabb” érzékelést nyújt a gépeknek abban a tekintetben, mi fog legközelebb történni, az emberek, állatok és tárgyak közötti magasabb szintű asszociációk felmérésével.
„Algoritmusunk újabb lépést tesz afelé, hogy a gépek megfelelőbb előrejelzéseket tudjanak adni az emberi viselkedésről, ezáltal jobban össze is hangolják cselekedeteiket a miénkkel” - mondta el Carl Vondrick, a Columbia Egyetem informatikai adjunktusa, a tanulmány vezetője. Olvasd el: "Hazudsz" - Rádióhullámokkal érzékeli az érzelmeket a mesterséges intelligencia
A mesterséges intelligencia újféle módon jósolja meg, mit tesz az ember következő lépésben
Eredményeiket a kutatók a számítógépes látás és a mintafelismerésről szóló nemzetközi konferencia keretében mutatták be 2021. június 24-én.
Mint azt Vondrick kiemelte, eredményeik számos lehetőséget nyújtanak az ember és a robot közötti együttműködésre, az autonóm járművek és a segítő technológiák fejlesztésére.
A szakemberek mai napig a videókon látható akciókat tartják a legpontosabb módszernek arra, hogy a gépek eseményeket jelezhessenek előre. Azután, hogy többezer órányi filmet, sportjátékot és műsorokat elemzett, a rendszer megtanul megjósolni többszáz tevékenységet, a kézrázástól az ököllel történő ütésig.
Amennyiben nem tud előrejelezni egy adott cselekvést, megtalálja azt a fogalmat, amely azt leginkább jellemzi, ebben az esetben az „üdvözlés” szót.
A prediktív gépi tanulás korábbi kísérletei - beleértve a Columbia csapatának próbálkozásait is -, egyszerre csak egy cselekvés előrejelzésére összpontosítottak. Olvasd el: Lefordítja a macskanyávogást a mesterséges intelligencia?
Az algoritmusok eldöntik, hogy egy műveletet ölelésnek, pacsizásnak, kézfogásnak vagy akár cselekvést nem tartalmazó figyelmen kívül hagyásként értékelnek-e. Ám amikor nagy a bizonytalanság, a legtöbb gépi tanulási modell nem képes megtalálni a közös lehetőségeket a potenciális opciók között.
Didac Suris és Ruoshi Liu, a Columbia Engineering PhD hallgatói ezért úgy döntöttek, más szemszögből vizsgálják a hosszabb hatótávolságú előrejelzési problémát.
„Nem minden jósolható meg előre a jövőben – mondta Suris, a tanulmány társ-szerzője. – Ha egy ember nem tudja előre látni, pontosan mi fog történni, a biztonságra megy és magasabb absztrakciós szinten jósol előre. Algoritmusunk az első, aki ezt a képességet megtanulja, absztrakt módon indokolja a jövőbeli eseményeket.”
Suris és Liu szokatlan geometriákat alkalmaztak olyan mesterséges intelligencia-modelleket készítésére, amelyek képesek magas szintű koncepciók szervezésére és megjósolják a jövőbeni emberi viselkedést.
L.A.