OpenAI está abriendo las puertas a una nueva era en la síntesis de voz con su innovadora plataforma llamada Voice Engine. Esta tecnología vanguardista puede crear una voz sintética basada en tan solo 15 segundos de una muestra de voz. Con la capacidad de leer texto en varios idiomas, Voice Engine está preparado para transformar la forma en que interactuamos con la tecnología.
“Estas implementaciones a pequeña escala están ayudando a informar nuestro enfoque, medidas de seguridad y pensamientos sobre cómo Voice Engine podría ser utilizado para el bien en diversas industrias”, explicó OpenAI en su comunicado oficial.
Empresas pioneras como Age of Learning, HeyGen, Dimagi, Livox y Lifespan ya están aprovechando las ventajas de esta tecnología. Desde la generación de contenido pre-escrito de voz hasta respuestas personalizadas en tiempo real, Voice Engine está revolucionando la forma en que nos comunicamos.
El desarrollo de Voice Engine comenzó en 2022 y ya ha impulsado voces predefinidas para la API de texto a voz y la función de Leer en voz alta de ChatGPT. Según Jeff Harris, miembro del equipo de producto de OpenAI para Voice Engine, el modelo fue entrenado con una combinación de datos con licencia y públicamente disponibles.
A pesar de ser un área en evolución, la generación de texto a audio por inteligencia artificial está ganando terreno rápidamente. Empresas como Podcastle y ElevenLabs están explorando tecnologías similares, pero la tecnología de OpenAI destaca por su innovación y seguridad.
Sin embargo, el avance tecnológico no está exento de desafíos éticos y regulatorios. Recientemente, el gobierno de EE. UU. prohibió las llamadas automáticas con voces de IA para combatir su uso no ético. OpenAI ha establecido estrictas políticas de uso para sus socios, asegurando que la Voice Generation se utilice de manera responsable y ética.
OpenAI también ha sugerido medidas adicionales para mitigar los riesgos asociados con esta tecnología, incluyendo la eliminación gradual de la autenticación basada en voz para acceder a cuentas bancarias y una mayor educación sobre los deepfakes de IA.
Con Voice Engine, OpenAI está liderando el camino hacia un futuro donde la síntesis de voz por inteligencia artificial se convierta en una herramienta omnipresente y segura para mejorar nuestras vidas.