Lifestyle / Tehnologija
OpenAI lansirao ChatGPT Images 2.0
OpenAI je predstavio svoj najnoviji model za generisanje slika, ChatGPT Images 2.0, koji donosi ogroman napredak u ispisivanju teksta unutar vizuelnih formata. Za razliku od prethodnih modela koji su se često mučili sa pravopisom kreirajući besmislene reči, novi model sada može besprekorno da dizajnira materijale poput menija za restorane sa potpuno tačnim tekstom.

izvor: techcrunch.com
Istorijski gledano, generatori slika su koristili difuzione modele koji su otežano rekonstruisali slova jer su učili obrasce iz piksela na celoj slici. Iako OpenAI nije otkrio tačnu tehnološku arhitekturu novog modela, istakli su da Images 2.0 poseduje "sposobnosti razmišljanja".
To mu omogućava da pretražuje internet, proverava sopstvene kreacije i stvara složene formate, poput marketinških materijala u različitim veličinama i stripova sa više panela. Pored toga, model sada znatno bolje razume i prikazuje nelatinična pisma, uključujući japanski, korejski, hindi i bengalski.
Iz kompanije OpenAI navode da Images 2.0 donosi neviđen nivo specifičnosti i može uspešno da renderuje elemente na kojima su stari modeli "pucali", poput malog teksta, ikonografije i elemenata korisničkog interfejsa, u rezoluciji do 2K. Iako generisanje ovako složenih vizuala može potrajati nekoliko minuta, kvalitet je neuporedivo veći.
Novi model biće dostupan svim korisnicima ChatGPT-a i Codex-a od sredine ove nedelje, dok će naprednije opcije biti rezervisane za korisnike koji plaćaju. Takođe, programerima će biti omogućen pristup gpt-image-2 API interfejsu.
izvor: techcrunch.com






