2024. 11. 26. - 10:25

„Okoskodó” MI-modellt adott ki egy kínai labor - az OpenAI o1 riválisát

„Okoskodó” MI-modellt adott ki egy kínai labor - az OpenAI o1 riválisát

„Okoskodó” mesterséges intelligencia modellt jelentetett meg egy kínai laboratórium, amely könnyen az OpenAI o1-ének a riválisa lehet.

Az első „okoskodó” mesterséges intelligencia modellel rukkolt elő egy kínai labor, amely riválisa lehet az OpenAI o1-ének.
 
A DeepSeek – egy kvantitatív kereskedők által finanszírozott mesterséges intelligencia-kutató cég -  november 20-án adta ki a DeepSeek-R1 előzetesét, amely véleményük szerint a o1-gyel versenyképes érvelési modell.
 
A legtöbb MI-modelltől eltérően az érvelési modellek hatékonyan ellenőrzik magukat, azzal, hogy több időt töltenek egy kérdés vagy lekérdezés mérlegelésével. Ez segít nekik elkerülni néhány olyan buktatót, amelyeken a modellek többnyire megbotlanak.
 
Elkerülhető buktatók?
 
Az o1-hez hasonlóan a DeepSeek-R1 feladatokon, előre tervezésen és műveletek sorozatán keresztül érvel, amelyek segítik a modellt a megfelelő válasz elérésében. Ez eltarthat egy ideig.
 
Az o1-hez hasonlóan a kérdés összetettségétől függően a DeepSeek-R1 is „gondolkodhat” tíz másodpercig, mielőtt válaszolna. Olvasd el: Generatív MI - a Gemini chatbot már meglepő dolgokra is emlékszik
 
„Okoskodó” MI-modellt adott ki egy kínai labor - az OpenAI o1 riválisát
„Okoskodó” MI-modellt adott ki egy kínai labor - az OpenAI o1 riválisát
 
A DeepSeek állítja, hogy a DeepSeek-R1 (pontosabban a DeepSeek-R1-Lite-Preview) az OpenAI o1-preview modelljével egyenrangú teljesítményt nyújt két népszerű MI benchmark, az AIME és a MATH tekintetében.
 
Az AIME más mesterséges intelligencia-modelleket használ a modell teljesítményének értékelésére, míg a MATH szöveges feladatok gyűjteménye. A modell azonban nem tökéletes.
 
Vannak azért gondok a modellel
 
Az X néhány kommentátora megjegyezte: a DeepSeek-R1 küzd a Tic-tac-toe nevű, kétszemélyes absztrakt stratégiai táblás játékkal és más logikai problémái is akadnak (ahogyan az o1-nek is).
 
A DeepSeek könnyen fel is törhető. Vagyis lehet úgy adni neki utasításokat – promptokat -, hogy figyelmen kívül hagyja a biztosítékokat. Az egyik X-felhasználó például arra kérte a modellt, adjon neki részletes meth (azaz methamphetamine) kábítószer receptet.
 
Az is kiderült, hogy a jelek szerint a DeepSeek-R1 blokkolja a politikailag túl érzékenynek ítélt lekérdezéseket.
 
A teszt során például a modell nem volt hajlandó válaszolni a Hszi Csin-ping kínai vezetővel, a Tienanmen térrel és Kína Tajvan megszállásának geopolitikai következményeivel kapcsolatos kérdésekre.
 
 
B.A.

Hírlevél feliratkozás

Kérjük, add meg adataidat a hírlevélre történő feliratkozáshoz! A megadott adatokat bizalmasan kezeljük, azokat harmadik félnek át nem adjuk.