2025. 07. 04. - 11:00
A Baidu generatív mesterséges intelligenciája elképesztő videókat generál

A Baidu új MuseSteamer modellje képes egyetlen képből lélegzetelállító videót készíteni, méghozzá professzionális minőségben.
A kínai Baidu újra átírta a tartalomgyártás szabályait: a MuseSteamer nevű videókészítő generatív mesterséges intelligenciája képes 10 másodperces, full HD minőségű, filmszerű videókat generálni pusztán egyetlen képből. A legmeglepőbb? Ezek a videók nemcsak mozgást tartalmaznak, hanem tökéletesen megkomponált arckifejezéseket, kameramozgásokat, hanghatásokat és narrációt is. Ez már nem deepfake, ez már digitális filmgyártás, másodpercek alatt.
A MuseSteamer nem egyedül dolgozik: az új Huixiang (绘想) platform biztosítja a kreatív környezetet, ahol az alkotók könnyedén tervezhetnek, szerkeszthetnek és testre szabhatnak minden részletet. Az intuitív felület olyan vizuális szerkesztést tesz lehetővé, amit korábban csak profi stúdiók tudtak biztosítani, most viszont bárki számára elérhető egy laptopon vagy mobilon keresztül is.
A rendszer lényege a kollektív teremtés: a mesterséges intelligencia nemcsak képet elemez, hanem értelmezi is a történetet, majd ennek alapján szcenáriót, karakter mozgást, hangulatot és tempót tervez. A karakterek mikrokifejezései, testtartása, sőt még a háttérzajok is valóságosnak hatnak. A Baidu szerint a modell globálisan első helyen végzett a VBench I2V ranglistán, pontosan 89,38%-os összteljesítménnyel.

A kínai generatív mesterséges intelligencia most már filmet is rendez
A MuseSteamer nem egyszerű generátor, hanem egy komplex kreatív társ. A vizuális nyelvi modell itt is kulcsszerepet játszik: az algoritmus nemcsak látja a képet, hanem érti is. Ez lehetővé teszi, hogy a generatív mesterséges intelligencia finom érzelmeket, narratív dinamizmust és szituációs összefüggéseket is megragadjon. Egy karakter mosolya például nemcsak egy arckifejezés, hanem történetmesélő eszköz, amit a generatív mesterséges intelligencia érzékenyen integrál a mozgóképbe.
A Huixiang platform egyedülálló módon teszi lehetővé, hogy a felhasználók együttműködjenek a géppel, tehát ne csak vezéreljék, hanem inspirálják. A generatív mesterséges intelligencia itt nem helyettesíti az emberi kreativitást, hanem katalizálja azt: új ötleteket szül, vizuálisan is támogatja a történetmesélést és elképesztő gyorsasággal képes prototípusokat gyártani. Ez egy igazi forradalom a tartalomgyártók kezében.
És ami talán a legfontosabb: a MuseSteamer demokratizálja a filmes alkotást. Már nem kell több milliós büdzsé, stáb és stúdió ahhoz, hogy valaki lenyűgöző mozgóképes tartalmat hozzon létre. Elég egy ötlet és egy kép, a többit elvégzi a generatív mesterséges intelligencia. A kreatív világ határai kiszélesedtek és ez még csak a kezdet.
CS.SZ.