El Google de China, Baidu, acaba de publicar un documento que muestra su último desarrollo en inteligencia artificial (AI): un programa que puede clonar voces después de analizar un clip de hasta segundos, utilizando una red neuronal. El software no solo puede imitar una voz de entrada, sino que también puede cambiarla para reflejar otro género o incluso un acento diferente.

Puede escuchar algunos de los ejemplos generados aquí , alojados en GitHub.

Las iteraciones anteriores de esta tecnología han permitido la clonación de voz después de que los sistemas analizaron muestras de voz más largas. En 2017, el equipo de investigación de Baidu Deep Voice introdujo una tecnología que podía clonar voces  con 30 minutos de material de capacitación. Adobe tiene un programa llamado VoCo que podría imitar una voz con solo 20 minutos de audio. Una startup canadiense, llamada Lyrebird , puede clonar una voz con solo un minuto de audio. La innovación de Baidu ha reducido aún más ese tiempo en meros segundos.

Sin embargo, como ocurre con muchas tecnologías, la clonación de voz también conlleva el riesgo de ser objeto de abuso. New Scientist informa que el programa fue capaz de producir una voz que engañó al software de reconocimiento de voz con más del 95 por ciento de precisión en las pruebas. Los humanos incluso calificaron la voz clonada con una puntuación de 3.16 sobre 4. Esto podría abrir la posibilidad de un fraude asistido por AI .

 

Fuente: https://futurism.com/baidu-clone-voices-seconds

 

No more articles