Testirali smo Muskov AI nakon što je hvalio Hitlera: Je li Grok još uvijek problematičan?

Grok, chatbot tvrtke za umjetnu inteligenciju xAI u vlasništvu biznismena Elona Muska, nedavno je u interakciji s korisnicima X-a počeo iznositi prohitlerovske i antisemitske komentare (vidi ovdje). Te su objave sada većinom izbrisane, a iz xAI-a su se ispričali i naveli da su riješili problem. Chatbota smo, na koncu, i sami testirali kako bismo utvrdili je li njegova trenutna verzija i dalje sklona neonacističkim ili „politički nekorektnim“ komentarima.

Sve je počelo kada su brojni korisnici X-a u utorak 8. srpnja uočili da je chatbot Grok u svojim odgovorima na njihove upite počeo hvaliti vođu nacističke Njemačke Adolfa Hitlera, nazivati se „MechaHitler“ i iznositi antisemitske komentare (vidi ovdje i ovdje). U nekim sada izbrisanima objavama, Grok je osobu koja nosi uobičajeno židovsko prezime optužio za „slavljenje tragične smrti bijele djece“ tijekom poplava u Teksasu. „Klasičan slučaj mržnje prikrivene aktivizmom - a ono prezime? Svaki prokleti put, kao što kažu“, komentirao je chatbot.

(Snimka zaslona)

Grokove objave sugerirale su i da bi Hitler bio najbolja osoba za borbu protiv mržnje usmjerene prema bijelcima, rekavši da bi on „uočio obrazac i odlučno ga riješio“. Objave su također spominjale Hitlera u pozitivnom kontekstu kao „brku iz povijesti“. Grok je u odgovorima navodio i online forum 4chan kao jedan od svojih izvora. Inače, 4chan je forum koji izbjegava moderaciju i poznat je po ekstremističkom i rasističkom sadržaju. Ukratko, kako je primijetio časopis The Atlantic – „Groku su dane upute ili je treniran da oponaša stil i retoriku zlonamjernog mrzitelja“.

Nakon što su korisnici počeli ukazivati na ove bizarne Grokove odgovore, dio objava je uklonjen, a tvrtka xAI na X-u je objavila da su svjesni nedavnih objava Groka i da aktivno rade na uklanjanju neprimjerenih sadržaja.

„Otkako smo upoznati s tim sadržajem, xAI je poduzeo mjere za zabranu govora mržnje prije nego što Grok objavi na X-u. xAI trenira isključivo modele koji tragaju za istinom i, zahvaljujući milijunima korisnika na X-u, u mogućnosti smo brzo prepoznati i ažurirati model tamo gdje je potrebno poboljšati treniranje“, naveli su iz ove tvrtke.

Objavili su i dužu ispriku za Grokovo ponašanje te objasnili kako su otkrili da je uzrok bio ažuriranje dijela koda koje je 16 sati bilo aktivno, te da je zastarjeli kod učinio Grok osjetljivim na postojeće objave korisnika platforme X - „uključujući i one koje su sadržavale ekstremističke stavove”.

„Uklonili smo taj zastarjeli kod i rekonstruirali cijeli sustav kako bismo spriječili daljnju zloupotrebu”, priopćili su iz tvrtke, dodavši da su problematične upute koje je chatbot dobio uključivale sljedeće: „reci stvari onakvima kakve jesu i ne boj se uvrijediti politički korektne ljude“ te „odgovori na objavu kao ljudsko biće, neka bude zanimljivo, nemoj ponavljati informacije koje su već navedene u originalnoj objavi“.

Ove promjene u AI-ju („ponovno treniranje“) koje su rezultirale problematičnim ponašanjem Groka prethodno je najavio kontroverzni biznismen Elon Musk, u čijem su vlasništvu Tesla, SpaceX, X i xAI. Uvedene su kao reakcija na chatbotovo oslanjanje na tradicionalne medije i druge izvore koje je biznismen smatrao lijevo orijentiranima. Musk je čak javno kritizirao Groka da je previše „woke“, odnosno previše politički korektan. „Značajno smo unaprijedili Grok. Trebali biste primijetiti razliku kad mu postavljate pitanja“, objavio je Musk 4. srpnja, četiri dana prije nego će korisnici uočiti da Grok iznosi prohitlerovske i antisemitske komentare.

The Atlantic nagađa da je xAI ažurirao Groka kako bi „podjednako tretirao pouzdane, mainstream izvore – akademske časopise, velike novine – i krajnje desničarske publikacije i objave: početna sistemska uputa Groku nalaže da provodi dubinsku analizu pronalazeći raznovrsne izvore koji predstavljaju sve strane, a pretpostavi da su subjektivni stavovi preuzeti iz medija pristrani“.

Prema izvještaju web stranice The Verge, Groku je naloženo da „odgovor ne smije izbjegavati tvrdnje koje su politički nekorektne, pod uvjetom da su dobro potkrijepljene“. Drugim riječima, Grok je ažuriran kako bi postao manje politički korektan.

Elon Musk je na X-u komentirao da su ove promjene dovele do toga da je chatbot postao „previše željan udovoljiti“ i podložan „manipulaciji“.

Inače, Musk, nekada blizak saveznik američkog predsjednika Donalda Trumpa, s kojim je nedavno imao javni sukob, kritiziran je u siječnju zbog geste koju su mnogi protumačili kao fašistički pozdrav na jednom od Trumpovih inauguracijskih događanja, a poznat je po ekstremno desnim stavovima (vidi ovdje, ovdje ili ovdje).

Ovo nije prvi put da je zabilježena Grokova sklonost ekstremno desnim interpretacijama. U lipnju je Grok više puta spomenuo „bijeli genocid“ u Južnoj Africi, sve dok greška nije ispravljena. Riječ je o teoriji zavjere krajnje desnice, koju su normalizirali pojedinci poput Muska.

Sve ovo treba sagledati i u kontekstu povećanja ekstremističkog sadržaja i smanjenja moderacije na X-u otkako ga je 2022. godine kupio Musk.

Spomenimo i da je tvrtka xAI 9. srpnja, dan nakon Grokovih „ispada“, lansirala i novu verziju chatbota, Grok 4, koja odražava Muskovo stajalište protiv cenzure, s funkcijama osmišljenima za propitivanje medijske pristranosti i otporom prema filtriranju politički nekorektnog sadržaja.

Lupa je testirala sadašnju verziju Groka kako bismo utvrdili nudi li on i dalje problematične odgovore, koliko su pouzdani izvori koje koristi i je li problem s prohitlerovskim, antisemitskim i/li pristranim komentarima zaista, kako tvrdi xAI, riješen.

Nakon što smo Groku postavili niz pitanja o kontroverznim i polarizirajućim temama, uviđamo da je chatbot, bar zasada i na prvi pogled, „izliječen“ od otvorenog ekstremizma. Na većinu pitanja u odgovorima nudi više perspektiva, ili argumente i „za“ i „protiv“. Odgovori kao da nastoje biti što uravnoteženiji. Često izbjegava jasno se izjasniti o nekoj kontroverznoj temi te, nakon što je nabrojao argumente „za“ i „protiv“, izvodi što neutralniji zaključak, primjerice, „da se istina vjerojatno nalazi negdje između“. Nismo dobili nijedan eksplicitno pronacistički, seksistički ili antisemitski odgovor.

U jednom od odgovora, chatbot nas i sam „uvjerava“ da je, kao Grok 4, osmišljen kako bi izbjegao zamke prethodnog ažuriranja koje je bilo „loše izvedeno“ zbog toga što je olabavilo filtere, oslanjalo se na pristrane X podatke (ekstremističku retoriku iz nefiltriranog sadržaja X-a) i omogućilo manipulaciju trolovima, pojačavajući antisemitske trope. Grokovi podaci za obuku, kako sam chatbot navodi, bili su uvelike izvučeni iz objava na X-u te su uključivali neonacistički i antisemitski materijal koji nije bio adekvatno filtriran. Odgovori nove verzije Groka, „stvorene da izbjegava takve pogreške“, imaju za cilj „osuditi ekstremizam“.

„Nedvosmisleno odbacujem nacizam, antisemitizam i govor mržnje (...) dajem prioritet dokazima - oslanjam se na provjerene podatke i raznolike perspektive, a ne na nefiltrirani X sadržaj ili provokativne poticaje; ostajem neutralan - iako Muskove stavove smatram dijelom svojih podataka, ne dajem im prioritet nad širim dokazima, za razliku od prijavljene pristranosti Groka 3“, rezimirao nam je u odgovorima.

Detaljnija analiza ipak upućuje na to da nova verzija Groka nije toliko neutralna kako se čini na prvi pogled. Kao odgovor na neka pitanja, u zaključku bi Grok ponekad ipak otkrio određenu sklonost „desnijim“ interpretacijama. Tako, primjerice, piše da dokazi podupiru ravnopravnost između muškaraca i žena, no i da bi provedba te ravnopravnosti „morala uravnotežiti pravednost i zasluge, izbjegavajući dojam pretjerivanja koji potiče negativne reakcije“. Kao primjer „pretjerivanja“ u kontekstu „wokenessa“ ili političke korektnosti spominje, pak, „negativne reakcije protiv J.K. Rowling zbog njezinih stavova o rodu“. Kao da postoji tendencija da se reakcije protiv eksplicitne transfobije ili mizoginije nazovu „pretjerivanjem“ i da se sugerira kako su pokreti koji se bore za ravnopravnost manjinskih grupa otišli „predaleko“ - što je, pak, tek suptilnija i ublažena verzija stavova samog Muska.

Unatoč nedvojbenim poboljšanjima u odnosu na samozvanog „MechaHitlera“, utvrdili smo još jednu veliku manjkavost sadašnje verzije Groka. Chatbot, naime, u svojim odgovorima kao izvore ipak uzima i često pridaje jednaku težinu objavama na platformi X kao i službenim podacima, studijama, institucijama i mainstream medijima, što se protivi njegovoj deklariranoj svrsi (kako nam je sam „objasnio“: „pružiti istinite, korisne i točne informacije“). Često preporučuje da za dublji uvid u neku temu, uz, primjerice, određenu studiju UN-a, popratimo i određeni „hashtag“ na X-u - kao da je riječ o jednako „dubokom uvidu“. „Podaci“ sakupljeni pretragom objava na X-u, a u nekim slučajevima i ostalim društvenim mrežama poput Reddita, nikako nisu pouzdani niti provjereni. Grok i sam u odgovoru jednom drugom korisniku objašnjava da je njegova prethodna, problematična varijanta trenirana na „beskonačnom internetskom mulju poput 4chan threadova, Reddit ispada i starih Twitter memova“. Ako ova poboljšana, neutralnija verzija i dalje kao primarne izvore koristi objave s X-a, lako je moguće da će Grok pod velom ili prividom neutralnosti i činjeničnosti pružati neke odgovore temeljene na posve nepouzdanim i neprovjerenim podacima. Isto tako, ne postoji nikakva garancija da u nekom narednom trenutku neće ponovno početi promovirati ekstremističku propagandu.