2024. 11. 18. - 08:35
Új mesterséges intelligencia-szemüveggel, szöveg- és képgenerátorral rukkolt elő a Baidu
Mesterséges intelligencia-alapú szemüveg formájú asszisztenssel és egy új, LLM-alapú szöveg- és képgenerátorral is előállt a Baidu kínai keresőóriás.
Mesterséges intelligencia-szemüveg asszisztenssel és új szöveg- és képgenerátorral is előrukkolt a 2024-es Baidu World kiállításon a kínai technológiai vállalat.
A Baidu, amely világszinten valódi keresőóriásnak számít, új alkalmazásokat jelentetett meg mesterséges intelligencia technológiájához, beleértve az MI-asszisztenshez csatlakoztatott okosszemüveget és az LLM-alapú szöveg-és képgenerátort.
Az új alkalmazásokat a cég éves konferenciáján mutatták be, melynek témája egyszerűen az volt: „az alkalmazások itt vannak”.
A vállalat vezérigazgatója, Robin Li a színpadon mutatta be az új intelligens szemüvegeket, amelyek beépített mesterséges intelligencia asszisztenssel rendelkeznek és a Baidu Xiaodu hardvermárkája fejlesztette ki őket – ennek vezetője Robin Li.
A szemüveg kamerákkal van felszerelve fényképek és videók rögzítésére, valamint lehetővé teszi a hang interakciót a Baidu Ernie platformjával, egy generatív MI-termékkel. Olvasd el: Már használható a ChatGPT hangos üzemmódja
Új mesterséges intelligencia-szemüveggel, szöveg- és képgenerátorral rukkolt elő a Baidu
A szemüveget viselők nyomon követhetik a kalóriafogyasztást, zenélhetnek és akár videózhatnak is – közölte a cég.
A technológiát, mely egyelőre csak Kínában kerül forgalomba jövő évtől, a Meta platform Ray-Ban okosszemüveg közvetlen riválisának tekintik.
MI-alapú szöveg-, kép- és kódgenerátor
A Baidu egyébként egy új, mesterséges intelligenciával vezérelt szöveg-kép technológiát is piacra dobott, I-RAG néven.
A technológia kihasználja a vállalat keresési képességeit a „hallucinációk” leküzdésére, amelyek akkor fordulhatnak elő, ha egy mesterséges intelligencia modell eltér a bemeneti szövegtől, vagy nem létező elemeket tartalmaz.
Ezenkívül a cég a Miaoda nevű LLM-alapú kódgenerátorral is előrukkolt, amely lehetővé teszi a felhasználók számára, hogy széleskörű kódolási szakértelem nélkül fejleszthessenek szoftveralkalmazásokat.
Az I-RAG és a Miaoda a Baidu közelmúltbeli jelentős befektetését követi a nagy nyelvi modellalkalmazások kereskedelmi forgalomba hozatalába.
A vállalat szerint a mesterséges intelligencia által vezérelt növekedés segített stabilizálni pénzügyeit 2024 második negyedévében.
Li kiemelte az MI-ügynököket, melyeket a „tartalom-, információ- és szolgáltatások hordozóinak” nevezett az MI-natív korszakban.
A Baidu vállalati szintű MI-ügynöke, a Qiaocang a vállalkozások számára lehetővé teszi, hogy testreszabott ügynököket hozzanak létre, beleértve az ügyfélszolgálati robotokat és az értékesítési asszisztenseket.
Az Ernie-bot már bizonyított
A Baidu 2023-ban piacra dobta az Ernie Bot v2.1.0-t, amelyet az Ernie 3.5 hajt. Akkor azt mondták, hogy a bot átfogó képességi pontszámok tekintetében felülmúlták a ChatGPT 3.5-öt, és több kínai nyelvi képességet illetően is felülmúlták a GPT-4-et.
A cég beágyazta Ernie Botot a meglévő termékeibe, például egy virtuális műszerfalba, amelyet a családok használhatnak az idős hozzátartozók megfigyelésére és ahonnan azok segítséget is kaphatnak - például emlékeztethetik őket a gyógyszerszedésre.
A Baidu szerint az Ernie platform naponta 1,5 milliárd felhasználói lekérdezést és interakciót kezel.
Ez több, mint a 2024 májusában bejelentett napi 200 millió kérés. Az interakciók közé tartozik a szöveg generálása, a kérdések megválaszolása és az MI-t használó különféle alkalmazásokban történő segítségnyújtás.
B.A.