Clonar la voz en 15 segundos. Suena a ciencia ficción y no es menos cierto que ya existen tecnologías por IA que son capaces de realizarlo. Pero si atendemos al matiz, este nuevo programa de Open AI da un paso más allá por su extrema fiabilidad en un corto periodo de tiempo y su fidelidad. Otea el horizonte y piensa en clonar cualquier voz humana con solo una muestra de audio de 15 segundos.
Así es el funcionamiento de Voice Engine: con tan solo una pequeña muestra de voz y un texto dado, el sistema puede producir un discurso que no solo resulta auténtico, sino que también refleja las emociones y el estilo del hablante original.
Voice Engine tiene la habilidad de ajustar el ritmo, la inflexión y la cadencia vocal para expresar un espectro diverso de emociones y situaciones. Ya sea adoptando una voz formal y autoritaria o una más cálida y coloquial, este sistema se configura para cumplir con los requerimientos particulares de distintos usos.
Este fascinante e inquietador resultado, a partes iguales, es posible gracias a los avances en inteligencia artificial y lo que se denomina el aprendizaje automático, que permiten al sistema entender y replicar las complejidades del habla humana.
Voice Engine ofrece un abanico de aplicaciones extenso y diverso. Por ejemplo, tiene la capacidad de brindar apoyo en la lectura a individuos con impedimentos visuales o retos en la lectura, proporcionando una interacción más íntima y auténtica. Asimismo, es capaz de realizar traducciones de materiales audiovisuales, como videos y pódcasts, facilitando a los productores y negocios el acceso a mercados internacionales sin perder la identidad de la voz original. Adicionalmente, posee la posibilidad de optimizar la oferta de servicios a distancia, contribuir a la rehabilitación vocal de pacientes y asistir a aquellos que se comunican de manera no verbal.
Pero, con un poder tan grande viene una gran responsabilidad, como diría el conocido tío Ben en Spiderman. Open AI está tomando un enfoque cauteloso con Voice Engine, reconociendo los riesgos potenciales de mal uso de voces sintéticas. Por ello, su acceso está muy restringido y se requiere el consentimiento explícito e informado del hablante original para su uso. La compañía está comprometida con el desarrollo de una IA segura y beneficiosa para todos, y continúa explorando cómo desplegar esta tecnología de manera responsable.