AI áttörés a hangtechnológiában

A technológia rohamos fejlődésének köszönhetően napjainkban már olyan mesterséges intelligenciával rendelkezünk, amely képes emberi hangok hihetetlenül valósághű utánzására. Az OpenAI, a népszerű ChatGPT chatbot fejlesztője, nemrégiben leleplezett egy új AI-eszközt, a Voice Engine-t, amely mindössze 15 másodperces hangminta alapján képes egy személy hangjának pontos másolatát létrehozni.

Az új technológia számos lehetőséget rejt magában, többek között az akadálymentesítés és a fordítás területén. Elképzelhető, hogy az AI-generált hangok segíthetnek azoknak, akik elveszítették a beszédképességüket, vagy a gyerekek olvasási készségeinek fejlesztésében. Ugyanakkor a szakértők aggódnak, hogy a hang-másolás technikája visszaélésekre is lehetőséget adhat, például a dezinformáció terjesztésére vagy csalások elkövetésére.


Az OpenAI ezért óvatosan kezeli a Voice Engine bevezetését. Jelenleg csak egy "szűk körű, megbízható partnerekkel" teszteli az eszközt, akik vállalják, hogy nem használják fel emberek beleegyezése nélkül a hangjukat, és egyértelműen jelzik a hallgatóknak, hogy az általuk hallott hang mesterséges. Az OpenAI szerint a hang-hitelesítési rendszerek fejlesztése és a "fekete lista" létrehozása is fontos lépés lehet a technológia biztonságos alkalmazása érdekében.

A Voice Engine nemcsak az eredeti beszélő hangját tudja másolni, hanem akár több nyelven is képes megszólalni. A cég blogbejegyzésében bemutatott példában egy ember angolul olvas fel egy szöveget, amit aztán a rendszer spanyolul, kínaiul, németül, franciául és japánul is megszólaltat - mindezt a beszélő eredeti hanghordozásával és akcentusával.

Ez a fejlesztés jól illeszkedik az OpenAI eddigi tevékenységébe. A vállalat nemrég mutatta be a Sora nevű, szövegből kiinduló videókészítő eszközét, valamint a ChatGPT chatbotot is, amely szöveges utasítások alapján képes képeket generálni. Ezek a technológiák mind azt jelzik, hogy a mesterséges intelligencia egyre inkább beépül mindennapjainkba, és forradalmasítja a tartalom-előállítás folyamatait.

Bár a hang-másolás technológiája számos pozitív lehetőséget rejt, a szakértők jogosan figyelmeztetnek a visszaélések veszélyeire is. Az OpenAI elkötelezett a biztonságos alkalmazás mellett, de a jövőben várhatóan további szabályozásra és társadalmi vitára lesz szükség e fejlesztések kapcsán.

Népszerű bejegyzések