Lifestyle / Tehnologija
Gemini 3.5 Live Translate: Simultani prevod govora na više od 70 jezika
Tehnološki gigant Google predstavio je Gemini 3.5 Live Translate, svoj najnoviji AI model za glasovno prevođenje koji omogućava komunikaciju u gotovo realnom vremenu na više od 70 jezika.

foto: google.com
Za razliku od tradicionalnih sistema koji čekaju kraj rečenice, ovaj model neprekidno procesira i generiše govor. Rezultat je prirodan i tečan prevod sa kašnjenjem od svega nekoliko sekundi, pri čemu AI uspešno zadržava originalnu intonaciju, ritam i visinu glasa govornika. Zahvaljujući naprednoj otpornosti na buku, model se automatski prilagođava glasnim okruženjima bez potrebe za ručnim podešavanjem.
Kako je najavljeno, Gemini 3.5 Live Translate će omogućiti video sastanke sa više od 2.000 jezičkih kombinacija unutar jednog poziva.
Novi model se postepeno uvodi u Google ekosistem. Programerima je dostupan u javnoj probnoj verziji putem Gemini Live API-ja, dok poslovni korisnici platforme Google Meet od ovog meseca dobijaju pristup privatnoj verziji.
Za širu javnost, tehnologija stiže direktno u aplikaciju Google Translate za Android i iOS. Korisnici Android uređaja dobijaju i inovativni "režim slušanja" (listening mode) – dovoljno je prisloniti telefon na uvo kao tokom običnog poziva i prevedeni audio će se strimovati privatno, bez potrebe za slušalicama.
Iz kompanije ističu da su prve testove uspešno sprovele globalne platforme poput kompanije Grab, koja beleži milione poziva između vozača i putnika. U svrhu bezbednosti i sprečavanja dezinformacija, sav generisani audio sadržaj sadrži neprimetni digitalni vodeni žig kreiran pomoću Google-ove tehnologije SynthID.
izvor: blog.google.com






