OpenAI, una de las compañías líderes en inteligencia artificial, ha dado un paso más en el desarrollo de esta tecnología con la creación de Voice Engine, un software capaz de replicar voces humanas de forma natural. Aunque esta innovación tiene un gran potencial, también plantea algunas preocupaciones sobre los posibles problemas que podrían surgir.
El origen de Voice Engine y su aplicación en productos de OpenAI
Según OpenAI, el desarrollo de Voice Engine se remonta a finales de 2022. Desde entonces, han utilizado esta tecnología para mejorar las voces preestablecidas disponibles en su API de conversión de texto a voz, así como en productos como ChatGPT Voice y Read Aloud. Esto significa que los usuarios ahora pueden disfrutar de voces más naturales y realistas al interactuar con los sistemas de OpenAI.
El entrenamiento de Voice Engine y la cuestión de los datos utilizados
En cuanto al entrenamiento de Voice Engine, OpenAI ha sido bastante reservado en cuanto a los detalles. Jeff Harris, miembro del equipo de producto de OpenAI, respondió a TechCrunch que se han utilizado una combinación de datos con licencia y disponibles públicamente. Aunque no se ha proporcionado información específica sobre las fuentes de datos utilizadas, es probable que OpenAI haya empleado una amplia variedad de grabaciones de voz para entrenar su modelo.
La facilidad de uso de Voice Engine y la generación de voces realistas
Una de las ventajas de Voice Engine es su facilidad de uso. Para generar un clip de audio con una voz clonada, simplemente se necesita una entrada de texto que describa lo que se desea (el prompt) y una muestra de audio de 15 segundos del hablante original. A partir de esta información, Voice Engine es capaz de crear un clip de audio con una voz que se asemeja mucho a la del hablante original.
Aunque la muestra de audio base es relativamente pequeña, OpenAI asegura que Voice Engine puede generar voces emotivas y realistas. Esto es un avance significativo en el campo de la clonación de voz, ya que hasta ahora era necesario contar con una cantidad mucho mayor de datos de entrenamiento para lograr resultados similares.
Si bien esta nueva tecnología es impresionante y tiene muchas aplicaciones potenciales, también plantea algunas preocupaciones. Por ejemplo, ¿qué podría pasar si alguien utiliza Voice Engine para clonar la voz de otra persona y cometer fraudes o engaños? ¿Cómo se protegerán los derechos de propiedad intelectual de las voces originales?
OpenAI ha reconocido que estos problemas son importantes y ha afirmado que está trabajando en medidas para abordarlos. Es fundamental establecer regulaciones y salvaguardias adecuadas para garantizar que Voice Engine se utilice de manera ética y responsable. Con una regulación adecuada y un uso responsable, esta tecnología puede beneficiar a la sociedad de muchas maneras.