OpenAI alat: generisanje glasa

04 april, 2024

Jelena Kalinić

OpenAI je predstavio novi alat koji može imitirati ljudski glas s iznenađujućom preciznošću. Ovaj AI generator glasa ima niz potencijalnih primjena, ali izaziva zabrinutost zbog dezinformacija i drugih oblika zloupotrebe.

Novi alat od OpenAI koji može generisati uvjerljiv klon bilo čijeg glasa koristeći samo 15 sekundi snimljenog audio zapisa ocijenjen je kao prevelik rizik za opštu distribuciju. Open AI radi testove kako bi bolje razumjeli posljedice primjene ove tehnologije.

Open AI laboratorija nastoji smanjiti prijetnju od štetnih dezinformacija u globalnoj godini izbora. Međutim, njihov razvoj tehnologije koje na osnovu vrlo kratkog audiozapisa može „klonirati” uvjerljiv glas, budi nepovjerenje i strah od širenja novih mogućnosti dezinformacija koje bi ovakva tehnologija omogućila.

Tehnologija kloniranja glasa nije posebno nova - postoji nekoliko modela sinteze glasa od 2022. godine, a tehnologija je aktivna u open source zajednici s paketima poput OpenVoice i XTTSv2.

Međutim, ono što je novo je ideja da OpenAI ide prema tome da dopusti bilo kome korištenje njihovog posebnog brenda tehnologije glasa. Praktično, to znači da bi bilo ko mogao klonirati bilo čiji glas. Zbog toga postoji oprez kompanije za potpuno puštanje u upotrebu ove tehnologije.

Voice Engine, kako se zove tehnologija, prvi put je razvijen 2022. godine, a početna verzija korištena je za pretvaranje teksta u govor kao značajka ugrađena u ChatGPT, vodeći AI alat organizacije. Međutim, njegova moć nikada nije javno otkrivena, djelomično zbog opreza kompanije.

„Mi se nadamo započeti dijalog o odgovornom implementiranju sintetičkih glasova i kako se društvo može prilagoditi ovim novim mogućnostima”, rekao je OpenAI u blogu.

„Na temelju tih razgovora i rezultata ovih testova malog obima, donijećemo informisaniju odluku o tome hoćemo li i kako implementirati ovu tehnologiju u većem obimu.”

U svom postu, kompanija je podijelila primjere stvarnih primjena tehnologije od različitih partnera koji su imali pristup njoj kako bi je integrirali u svoje vlastite aplikacije i proizvode.

Neki od primjera ove tehnologije uključuju asistenciju u čitanju ljudima koji ne čitaju, slabovidnim osobama ili djeci kroz glas koji zvuči ljudski i prijatno, recimo, glas roditelja. Zatim tu je i primjena u prevoditeljstvu te terapeutska primjena kod pacijenata koji trebaju oporaviti glas.

Jelena Kalinić

Biolog, dopisnik Glasa Amerike za nauku, i dobitnica EurekaAlert (AAAS) Felowship 2020. za naučne novinare. Vodi blog Quantum of Science od 2015.

Pratite Pratite

Preuzmite besplatno VOA aplikaciju: Jednostavno do najvažnijih vijesti

Video

Hrvatski veterani pomažu ranjenim Ukrajincima

OpenAI alat: generisanje glasa

Jelena Kalinić

Preuzmite besplatno VOA aplikaciju: Jednostavno do najvažnijih vijesti

Video

Hrvatski veterani pomažu ranjenim Ukrajincima

6 mjeseci ostalo je do američkih izbora

Izrael dočekuje studente koji žele napustiti američke univerzitete

Nastojanja da se ublaže napetosti na Bliskom istoku

Svečano otvorena zadnja obnovljena banjalučka džamija Arnaudija

Recommended

Električna energija iz čistih izvora dostigla 30% globalne proizvodnje u 2023.

Linkovi

Pratite nas

OpenAI alat: generisanje glasa

Jelena Kalinić

Preuzmite besplatno VOA aplikaciju: Jednostavno do najvažnijih vijesti

Video

Hrvatski veterani pomažu ranjenim Ukrajincima

6 mjeseci ostalo je do američkih izbora

Izrael dočekuje studente koji žele napustiti američke univerzitete

Nastojanja da se ublaže napetosti na Bliskom istoku

Svečano otvorena zadnja obnovljena banjalučka džamija Arnaudija

Recommended

Električna energija iz čistih izvora dostigla 30% globalne proizvodnje u 2023.