Google uvodi novu i napredniju generaciju AI prevođenja koja bi mogla promijeniti način na koji komuniciraju ljudi koji govore različite jezike.
Kompanija je predstavila Gemini 3.5 Live Translate, novu generaciju sistema za prevođenje govora u stvarnom vremenu.
Bez prekida
Ova tehnologija podržava više od 70 jezika i omogućava znatno prirodniju komunikaciju između sagovornika koji ne govore isti jezik.
Za razliku od klasičnih prevodilaca koji čekaju da osoba završi rečenicu prije nego što započnu prevod, Gemini 3.5 Live Translate koristi kontinuirano generisanje prevoda.
Sistem istovremeno sluša govor i prevodi ga, pa razgovor teče gotovo bez prekida, praktično u realnom vremenu.
Google navodi da nova tehnologija ne prevodi samo riječi, već nastoji sačuvati ton glasa, brzinu govora i intonaciju originalnog sagovornika.
Zahvaljujući tome, prevedeni govor zvuči mnogo prirodnije nego kod dosadašnjih sistema mašinskog prevođenja.
Nova funkcija postepeno stiže u aplikaciju Google Translate za Android i iOS uređaje.
Posebno zanimljiva novost za Android korisnike je "Listening Mode", odnosno način rada koji omogućava slušanje prevedenog govora direktno preko zvučnika telefona, čak i kada korisnik nema povezane slušalice.
Google istovremeno proširuje mogućnosti prevođenja i u poslovnom okruženju. Nakon integracije s platformom Google Meet, nova tehnologija omogućava više od 2.000 jezičkih kombinacija za simultano prevođenje tokom videopoziva i online sastanaka.
Ova funkcionalnost trenutno je dostupna ograničenom broju poslovnih korisnika usluge Google Workspace kroz program privatnog testiranja.
Vodeni žig
Kompanija je omogućila pristup novom sistemu i programerima putem platforme Google AI Studio i Gemini Live API-ja.
Među prvim kompanijama koje testiraju ovu tehnologiju nalazi se i platforma za prijevoz putnika Grab, koja istražuje načine za lakšu komunikaciju između vozača i putnika tokom međunarodnih putovanja.
Kako bi spriječio moguće zloupotrebe sadržaja generisanog vještačkom inteligencijom, Google je implementirao i SynthID, digitalni vodeni žig koji će biti ugrađen u sav audio sadržaj kreiran pomoću sistema Gemini 3.5 Live Translate.
Na taj način bit će moguće lakše prepoznati sadržaj koji je nastao uz pomoć AI tehnologije, što bi trebalo doprinijeti većoj transparentnosti i sigurnosti u korištenju ovakvih alata.