Küszöbön a gondolatolvasó mesterséges intelligencia? Íme a DALL-E!
Az amerikai székhelyű OpenAI mesterséges intelligencia kutatócsoport olyan technológiát fejleszt, amely lehetővé teszi a felhasználók számára, hogy digitális képeket hozzanak létre azáltal, hogy leírják, mit szeretnének látni.
A program neve DALL-E, melyet a 2008-as, autonóm robotról szóló animációs film, a WALL-E, valamint a szürrealista festő, Salvador Dalí ihletett - írja a New York Times.
Az OpenAI egy mesterséges intelligencia laboratórium, melynek létrehozásában Elon Musk 2015-ben segédkezett. Egyelőre nem osztották meg az eszközt a nyilvánossággal, de a területtel foglalkozó kutatók már regisztrálhatnak online, hogy előzetesen megnézhessék. A cég azt tervezi, hogy később harmadik féltől származó alkalmazásokban is elérhetővé teszi.
A program működését demonstrálva az egyik kutató, Alex Nichol "egy avokádó alakú teáskannát" írt le, mire a rendszer 10 különböző képet hozott létre egy mohazöld avokádós teáskannáról. "A DALL-E jól ért az avokádókhoz" - mondta Nichol a NYT-nek.
A DALL-E a mesterséges intelligencia segítségével állít össze képeket a "gondolatokból"
A DALL-E képes a képek szerkesztésére is. Nichol ismét demonstrálta ezt a funkciót, amikor egy víz alatt trombitáló mackó képét használta és helyette egy gitárt gépelt be a rendszerbe. A rendszer azonnal egy olyan képet generált, amelyen ugyanez a mackó egy gitárt tart szőrös kezében.
A technológia azonban nem tökéletes. Amikor arra kérték, hogy "helyezze az Eiffel-tornyot a Holdra", a rendszer ezzel szemben a Holdat helyezte a torony fölé. Aztán amikor Nichol azt kérte, hogy "egy homokkal teli nappalit" ábrázoljon a rendszer, egy olyan kép született meg, amely inkább egy építkezéshez hasonlított.
A NYT szerint hét kutató két évet töltött a technológia kifejlesztésével. Az OpenAI azt tervezi, hogy végül grafikusok számára is felajánlja azt.
A cég mögött egyébként ott áll a Microsoft is, amely 2019-ben 1 milliárd dollárt fektetett be az OpenAI projektjeibe.
V.V.