OpenAI anuncia Voice Engine, una herramienta que imita las voces humanas

OpenAI ha desvelado los primeros resultados de su innovadora tecnología de conversión de texto en voz, denominada Voice Engine, diseñada para leer textos con voces que se asemejan a las humanas, lo que ha despertado tanto entusiasmo como inquietudes éticas en la comunidad de inteligencia artificial. En un avance limitado compartido con unos 10 desarrolladores, la tecnología muestra la capacidad de imitar voces específicas, incluidas sus cadencias y entonaciones únicas, tras analizar sólo 15 segundos de entrada de audio.

La presentación se produce en medio de un intenso escrutinio sobre el posible uso indebido de la IA en la creación de contenidos falsos, especialmente en contextos delicados como las elecciones. En un principio, OpenAI planeó un lanzamiento más amplio, para un máximo de 100 desarrolladores, pero lo redujo tras consultar a partes interesadas de diversos sectores, como responsables políticos, expertos del sector y educadores. Este enfoque cauteloso refleja el compromiso de la empresa con el desarrollo ético de la IA, dando prioridad a la seguridad de la sociedad sobre el avance tecnológico.

“Estamos colaborando con socios estadounidenses e internacionales de los sectores de la administración pública, los medios de comunicación, el entretenimiento, la educación y la sociedad civil, entre otros, para asegurarnos de que incorporamos sus comentarios a medida que avanzamos”, afirmaba OpenAI en una reciente entrada de su blog. El objetivo de esta colaboración es mitigar los riesgos asociados a la generación de un habla muy parecida a la voz humana real.

El potencial de la tecnología se demostró al reproducir un fragmento del CEO de OpenAI, Sam Altman, explicando la tecnología, que sonaba indistinguible de su voz real, pero generada totalmente por la IA. Jeff Harris, jefe de producto de OpenAI, destacó la calidad técnica de la herramienta al tiempo que reconocía la “delicadeza de seguridad” que rodea a su capacidad para imitar con precisión el habla humana.

Entre los primeros usuarios de Voice Engine se encuentra el Instituto de Neurociencias Norman Prince de Lifespan, que empleó la herramienta para ayudar a una joven paciente a recuperar su voz, perdida anteriormente a causa de un tumor cerebral, replicando su habla a partir de la grabación de un proyecto escolar anterior. Además, Spotify ha explorado la tecnología para traducir podcasts a diferentes idiomas, lo que indica las diversas aplicaciones de Voice Engine más allá de la mera imitación de la voz.

Para abordar los problemas éticos, OpenAI exige a sus socios que se adhieran a estrictas políticas de uso, como obtener el consentimiento de las personas antes de replicar sus voces y revelar claramente a los oyentes que el contenido está generado por IA. Un aspecto innovador de la tecnología es la inclusión de una marca de agua de audio inaudible que permite identificar los contenidos creados por Voice Engine.

Mientras OpenAI sigue recabando opiniones sobre esta tecnología, subraya las implicaciones sociales más amplias de las herramientas avanzadas de IA. La empresa ha abogado por medidas como la eliminación progresiva de la autenticación por voz en la banca y el aumento de la concienciación pública sobre los contenidos generados por IA para reforzar la resistencia de la sociedad frente a posibles usos indebidos de esta tecnología.

La cuidadosa navegación de OpenAI por el panorama ético que rodea a Voice Engine es señal de un enfoque responsable del desarrollo de la IA, que equilibra la innovación con el imperativo de proteger contra los riesgos de uso indebido en un mundo cada vez más digital.





vi-premio-de-periodismo-editorial-hypermedia

VI Premio de Periodismo “Editorial Hypermedia”

Por Hypermedia

Convocamos el VI Premio de Periodismo “Editorial Hypermedia” en las siguientes categorías y formatos:
Categorías: Reportaje, Análisis, Investigación y Entrevista.
Formatos: Texto escrito, Vídeo y Audio.
Plazo: Desde el 1 de febrero de 2024 y hasta el 30 de abril de 2024.