OpenAI, la reconocida empresa de inteligencia artificial, anunció este lunes que su nuevo modelo, Voice Engine, tiene la capacidad de clonar voces humanas de manera “emotiva y realista” a partir de una muestra de solo 15 segundos. Sin embargo, la compañía ha decidido no lanzar esta tecnología al público general debido a los riesgos potenciales asociados.
Voice Engine es un modelo de IA que puede convertir texto a voz para crear voces sintéticas. Según OpenAI, esta tecnología podría permitir a los creadores de contenido traducir su trabajo a otros idiomas sin perder sus acentos nativos. Además, podría ayudar a las personas con problemas de comunicación verbal a utilizar su voz para realizar tareas cotidianas, como hacer llamadas telefónicas.
La empresa ha demostrado la eficacia de Voice Engine con varios ejemplos, incluyendo la traducción de la voz de una anglosajona al español, mandarín, alemán, francés y japonés, conservando el acento nativo de la persona.
Por el momento, solo un número limitado de empresas tienen acceso a esta tecnología, incluyendo Age of Learning, HeyGen, Dimagi, Livox y Lifespan.
OpenAI ha expresado su preocupación por el potencial mal uso de la voz sintética, especialmente en un año electoral. La empresa ha implementado medidas de seguridad, como marcas de agua para rastrear el origen de cualquier audio generado por Voice Engine y un monitoreo proactivo de su uso. Además, las empresas que tienen acceso a esta tecnología han aceptado las políticas de uso de OpenAI, que incluyen no utilizar la voz de alguien sin su consentimiento y notificar a los usuarios cuando se utilizan voces sintéticas.
Este anuncio llega en un momento en que ya se han reportado casos de llamadas automáticas con voces clonadas de políticos en Estados Unidos. Además, existe la preocupación de que los estafadores puedan utilizar las voces sintéticas generadas por IA para acceder a cuentas bancarias que utilizan autenticación de voz.