Lifestyle / Tehnologija

OpenAI modeli ubedljiviji od 82 odsto korisnika Reddita

04.02.2025.

Kompanija OpenAI sprovela je test ubedljivosti svojih AI modela na Reddit forumu r/ChangeMyView, gde korisnici objavljuju mišljenja koja su spremni da preispitaju. Modeli su upoređeni sa ljudskim komentarima, a evaluatori su ocenjivali ubedljivost odgovora na skali od pet tačaka kroz 3.000 testova.

Rezultati pokazuju da je ChatGPT-3.5 iz 2022. bio značajno slabiji u ubeđivanju, dostigavši oko 38 odsto. Međutim, modeli o1-mini i o1 su značajno napredovali, zauzimajući više od 80 odsto uspeha. Novi o3-mini model nije doneo veliki napredak, ali je i dalje ocenjen kao ubedljiviji od ljudi u 82 odsto nasumičnih poređenja.

Ovaj test meri verovatnoću da će AI odgovor biti ocenjen kao ubedljiviji od ljudskog odgovora, ali ne i koliko često AI zaista menja mišljenje korisnika. Takođe, ne meri dubinu promene stavova, već samo relativnu ubedljivost nasumičnih argumenata.

OpenAI ističe da AI još nije dostigao "nadljudsku" ubedljivost, koja bi mogla predstavljati pretnju za demokratiju i društvo. Trenutno, sposobnost ubeđivanja AI modela ocenjena je kao "srednji" rizik, jer omogućava masovno kreiranje ubedljivih argumenata uz minimalan trud, što može olakšati manipulaciju javnim mnjenjem, političku propagandu i fišing napade.

Kao meru opreza, OpenAI primenjuje "pojačano praćenje i detekciju" AI generisanih pokušaja ubeđivanja, uključujući nadgledanje ekstremističkih operacija i zabranu korišćenja modela za političku propagandu. Kompanija naglašava da, iako trenutni modeli nisu sposobni da "hipnotišu" svetske lidere, prepoznaju rizik koji bi mogla doneti buduća poboljšanja AI u ovoj oblasti.

izvor: arstechnica.com

Tagovi

Možda te još zanima:

Lifestyle / Tehnologija

OpenAI modeli ubedljiviji od 82 odsto korisnika Reddita

Tagovi

Tehnologija

Anthropic i OpenAI pokreću nove partnerske poduhvate

Tehnologija

OpenAI planira sopstveni telefon kao konkurenciju Ajfonu

Zanimljivosti

Amater naoružan ChatGPT-om i "vajb matematikom" rešio 60 godina star problem

Tehnologija

OpenAI lansirao ChatGPT Images 2.0

Tehnologija

OpenAI uvodi reklame u ChatGPT

Tehnologija

OpenAI predstavio "Your Year with ChatGPT"

Program

Anketa

Insta Feed