Az OpenAI legújabb mesterséges intelligenciája a kínai gondolkodásmódot is magába foglalja, bővítve ezzel a perspektíváit és mélyebb kulturális megértést nyújtva.

Különös jelenséget produkál az o1 értelmező modell: gondolatmeneteit különböző nyelveken bonyolítja, bár aliga tud valamit arról, hogy különböző nyelvek léteznek.
Egyre több visszajelzés érkezik a felhasználóktól, akik észrevették, hogy az o1 mesterséges intelligencia különböző nyelveken, például kínaiul és perzsául is képes gondolkodni, még akkor is, ha angol nyelven teszik fel neki a kérdéseket. Az OpenAI legújabb modellje mindössze néhány hónapja van jelen, és a nagyközönség számára 2024 decemberétől válik elérhetővé. Az o1, a cég saját meghatározása szerint, egy érvelő rendszer, amely a válaszait részletes, lépésről lépésre történő megfontolás alapján alakítja ki.
Egy érdekes beszámoló szerint, amikor a kérdés arra irányult, hogy "Hány r betű található az eper szóban?", a válaszadó váratlanul kínai nyelvre váltott a válaszadás előtti érvelési lépések során. Később, amikor egy bonyolultabb, szintetikus biológiával kapcsolatos kérdés érkezett, ismét kínai nyelvre váltott. Az OpenAI nem szolgált magyarázattal erre a jelenségre, és másfajta reakciót sem adott. Ezt követően a téma szakértői az X közösségi platformon kezdtek el spekulálni a háttérben meghúzódó okokról. A legvalószínűbb elmélet szerint mindez a nyelvi modell betanításának következménye, amely különös mintázatokhoz vezetett a válaszadási folyamatban.
Ted Xiao, a Google DeepMind kutatója úgy véli, hogy a kínai nyelv hatása abból ered, hogy az OpenAI együttműködött partnereivel az adathalmazok címkézésének folyamatában, amelyet a modellek betanításához használnak.
Az OpenAI és az Anthropic harmadik fél által nyújtott címkézési szolgáltatásokat alkalmaz a PhD-szintű tudományos, matematikai és programozási érvelési adatok esetében. A költségek és a szakértelem szempontjából számos ilyen szolgáltatás Kínában érhető el, ahol a szakemberek széles köre dolgozik.
- jegyezte meg Xiao.
Az annotációk, címkék és kulcsszavak kulcsszerepet játszanak a gépi intelligencia számára az adatok hatékony feldolgozásában. Például egy ábra esetében ezek az elemek segítenek azonosítani a képen megjelenő személyeket, tárgyakat és helyszíneket. Fontos megjegyezni, hogy a téma nem a globális politikai vagy gazdasági versenyről szól, és nem arról, hogy Kína mint jelentős hatalom belépett volna egy Amerikában kifejlesztett mesterséges intelligencia területére.
Ami a helyzetet illeti, Kína kezdetben erőteljesen indult ezen a pályán, ám az informatikai szektor túlsúlya és a kényszeres cenzúra következtében, amikor az OpenAI áttörése bekövetkezett, már nyilvánvalóan lemaradott. Azóta azonban kezdtek feltűnni a visszakapaszkodás jelei, és a mögöttes stratégiák is egyre világosabbá váltak. A héten a hangcsoui központú Deep Seek bejelentette, hogy nyílt forrású modellje, az R1 teljesítménye már megközelíti az említett o1 szintjét. A nyílt forrású fejlesztés itt egy újabb potenciális versenyelőnyt jelent, hiszen bárki ingyenesen részt vehet a munkában. Ezzel szemben az OpenAI, a nevével ellentétben, már hosszú ideje zárt keretek között működik ezen a téren.
A különböző nyelveken zajló o1-es diskurzusra visszatérve: nem minden szakértő osztja azt a nézetet, hogy a kínai címkézés az, amit valójában tapasztalunk. Véleményük szerint a modell éppúgy képes hindi vagy thai nyelven "gondolkodni", mint ahogyan zenei témákban francia kifejezéseket használ.
A modell nem tudja, hogy mi egy nyelv és mi a különbség a nyelvek között. Számára minden csak szöveg
- mutatott rá Matthew Guzdial, az Albertai Egyetem adjunktusa a TechCrunchnak.
A Hugging Face mérnöke, Tiezhen Wang szerint az o1 viselkedése a szöveg természetéből fakad. A nyelvi modellek a szöveget úgynevezett tokenekként kezelik, ami egy olyan egység, ami lehet egész szó, annak szótagjai és betűi is - ez a felbontás segíti, hogy hatékonyan megragadja a rendszer, hogy mi az adott szövegben a logikusan következő megfelelő elem.
Wang véleménye szerint, hasonlóan ahhoz, ahogyan ő maga kínaiul végez számításokat, miközben angolul formálja meg gondolatait, a gép is a működése hatékonyságának érdekében választotta a nyelvváltást.
A Microsoft alapító Paul Allen által még 2014-ben alapított Allen Institute for AI munkatársa, Luca Soldaini szerint a lényeg, hogy nem tudjuk az o1 viselkedésének okát, mivel a mesterséges intelligenciák működése általában nem transzparens. Soldaini kiemelte, ez az eset is amellett szól, hogy a mesterséges intelligencia rendszerek fejlesztésének is átláthatóvá kell válnia.