Linkovi

OpenAI alat: generisanje glasa


OpenAI je predstavio novi alat koji može imitirati ljudski glas s iznenađujućom preciznošću. Ovaj AI generator glasa ima niz potencijalnih primjena, ali izaziva zabrinutost zbog dezinformacija i drugih oblika zloupotrebe.

Novi alat od OpenAI koji može generisati uvjerljiv klon bilo čijeg glasa koristeći samo 15 sekundi snimljenog audio zapisa ocijenjen je kao prevelik rizik za opštu distribuciju. Open AI radi testove kako bi bolje razumjeli posljedice primjene ove tehnologije.

Open AI laboratorija nastoji smanjiti prijetnju od štetnih dezinformacija u globalnoj godini izbora. Međutim, njihov razvoj tehnologije koje na osnovu vrlo kratkog audiozapisa može „klonirati” uvjerljiv glas, budi nepovjerenje i strah od širenja novih mogućnosti dezinformacija koje bi ovakva tehnologija omogućila.

Tehnologija kloniranja glasa nije posebno nova - postoji nekoliko modela sinteze glasa od 2022. godine, a tehnologija je aktivna u open source zajednici s paketima poput OpenVoice i XTTSv2.

Međutim, ono što je novo je ideja da OpenAI ide prema tome da dopusti bilo kome korištenje njihovog posebnog brenda tehnologije glasa. Praktično, to znači da bi bilo ko mogao klonirati bilo čiji glas. Zbog toga postoji oprez kompanije za potpuno puštanje u upotrebu ove tehnologije.

Voice Engine, kako se zove tehnologija, prvi put je razvijen 2022. godine, a početna verzija korištena je za pretvaranje teksta u govor kao značajka ugrađena u ChatGPT, vodeći AI alat organizacije. Međutim, njegova moć nikada nije javno otkrivena, djelomično zbog opreza kompanije.

„Mi se nadamo započeti dijalog o odgovornom implementiranju sintetičkih glasova i kako se društvo može prilagoditi ovim novim mogućnostima”, rekao je OpenAI u blogu.

„Na temelju tih razgovora i rezultata ovih testova malog obima, donijećemo informisaniju odluku o tome hoćemo li i kako implementirati ovu tehnologiju u većem obimu.”

U svom postu, kompanija je podijelila primjere stvarnih primjena tehnologije od različitih partnera koji su imali pristup njoj kako bi je integrirali u svoje vlastite aplikacije i proizvode.

Neki od primjera ove tehnologije uključuju asistenciju u čitanju ljudima koji ne čitaju, slabovidnim osobama ili djeci kroz glas koji zvuči ljudski i prijatno, recimo, glas roditelja. Zatim tu je i primjena u prevoditeljstvu te terapeutska primjena kod pacijenata koji trebaju oporaviti glas.

  • 16x9 Image

    Jelena Kalinić

    Biolog, dopisnik Glasa Amerike za nauku, i dobitnica EurekaAlert (AAAS) Felowship 2020. za naučne novinare. Vodi blog Quantum of Science od 2015.

XS
SM
MD
LG