Tecnología de voz Archives - TecnoFuturo24

OpenAI y su servicio Voice Engine: avances, retrasos y el futuro de la clonación de voz

TecnoFuturo 24 — Thu, 06 Mar 2025 19:52:51 +0000

En marzo de 2024, OpenAI anunció la versión de prueba de su innovador servicio de clonación de voz, Voice Engine. Esta tecnología, capaz de replicar la voz de una persona con tan solo 15 segundos de grabación, ha despertado gran interés en diversos sectores, desde la atención al cliente hasta la terapia del habla. Sin embargo, un año después, la herramienta sigue sin una fecha de lanzamiento definitiva, lo que ha generado especulaciones sobre los motivos de su retraso y el futuro de la clonación de voz con inteligencia artificial (IA).

Retrasos y preocupaciones en torno a Voice Engine

La decisión de OpenAI de no lanzar aún Voice Engine a un público más amplio podría deberse a varias razones. Una de ellas es el temor al mal uso de la tecnología, especialmente en un contexto donde las voces clonadas pueden ser empleadas para fraudes y desinformación. Otro motivo podría ser la regulación emergente en torno a las tecnologías de IA, que podría afectar su despliegue comercial.

Históricamente, OpenAI ha sido criticada por priorizar el lanzamiento rápido de productos innovadores en detrimento de la seguridad. Sin embargo, en esta ocasión, la empresa parece estar adoptando un enfoque más cauteloso. En un comunicado a TechCrunch, un portavoz de la compañía aseguró que continúan evaluando la herramienta con un grupo limitado de socios de confianza. “Estamos aprendiendo cómo nuestros socios están utilizando la tecnología para mejorar la utilidad y seguridad del modelo”, afirmó el representante de OpenAI.

La tecnología detrás de Voice Engine

Voice Engine funciona mediante un modelo de IA que analiza y predice los sonidos más probables que haría un hablante al leer un texto. Además, tiene la capacidad de imitar acentos y estilos de habla, lo que la hace una herramienta poderosa para aplicaciones como la accesibilidad, los asistentes virtuales y la creación de contenido multimedia.

El sistema se basa en la tecnología que impulsa las voces del modo de voz de ChatGPT y la API de conversión de texto a voz de OpenAI. Sin embargo, su lanzamiento ha estado marcado por retrasos desde su fase inicial de desarrollo. Según documentos filtrados, la compañía planeaba abrir el acceso a Voice Engine a un grupo selecto de desarrolladores en marzo de 2024, con tarifas establecidas en $15 por millón de caracteres para voces estándar y $30 para voces en calidad HD.

A última hora, OpenAI decidió posponer el anuncio y restringir el acceso a un grupo aún más reducido de colaboradores. “Esperamos iniciar un diálogo sobre el despliegue responsable de voces sintéticas y cómo la sociedad puede adaptarse a estas nuevas capacidades”, explicó la empresa en su blog.

Un desarrollo que viene de lejos

Voice Engine no es un proyecto reciente. OpenAI lleva desarrollándolo desde 2022 y, según la empresa, ha sido presentado a responsables políticos a nivel global para destacar tanto su potencial como sus riesgos. Actualmente, algunos socios selectos han podido probar la tecnología, como la startup Livox, que desarrolla dispositivos para mejorar la comunicación de personas con discapacidad. Aunque la empresa destacó la calidad de la herramienta, también señaló limitaciones, como la necesidad de conexión a internet.

“La calidad de la voz y la posibilidad de hablar en diferentes idiomas es única, especialmente para nuestros clientes con discapacidades”, comentó Carlos Pereira, CEO de Livox. Sin embargo, la empresa no ha recibido información sobre una posible fecha de lanzamiento ni sobre costos futuros del servicio.

Riesgos y medidas de seguridad

Uno de los principales desafíos de Voice Engine es garantizar su uso responsable. OpenAI ha implementado algunas medidas de seguridad, como la marca de agua en los audios generados para rastrear su origen y el requisito de obtener el consentimiento explícito del hablante original antes de utilizar la herramienta. Además, los desarrolladores deben informar claramente a sus audiencias que las voces son generadas por IA.

No obstante, la aplicación efectiva de estas políticas a gran escala sigue siendo un reto. La verificación de identidad y la creación de una lista de “voces prohibidas” para evitar la clonación de figuras prominentes son proyectos en desarrollo que aún no han sido implementados de manera definitiva.

El auge de las estafas con clonación de voz refuerza la necesidad de regulaciones más estrictas. En 2024, este tipo de fraude se convirtió en una de las prácticas ilícitas de mayor crecimiento, afectando la seguridad bancaria y la privacidad de los usuarios. La creación de deepfakes de celebridades y políticos ha exacerbado el problema, generando preocupaciones sobre la desinformación en redes sociales.

El incierto futuro de Voice Engine

A pesar del prolongado periodo de prueba, OpenAI aún no ha decidido si lanzará Voice Engine al público general. La compañía ha mencionado la posibilidad de mantener el servicio en una escala reducida, lo que podría indicar que las preocupaciones sobre seguridad y regulación pesan más que el potencial comercial de la herramienta.

Mientras tanto, la demanda de tecnologías de clonación de voz sigue creciendo. Empresas de diversos sectores exploran el uso de IA generativa para mejorar la atención al cliente, la accesibilidad y la producción de contenido. La decisión de OpenAI podría marcar un precedente clave en la regulación y desarrollo de este tipo de tecnologías.

Las próximas semanas podrían ser cruciales para determinar el destino de Voice Engine. Si OpenAI decide avanzar con su lanzamiento, deberá demostrar que cuenta con medidas de seguridad robustas para evitar abusos. Si, por el contrario, opta por mantener su acceso restringido, podría estar enviando una señal sobre los desafíos y riesgos que la clonación de voz con IA aún presenta.

The post OpenAI y su servicio Voice Engine: avances, retrasos y el futuro de la clonación de voz appeared first on TecnoFuturo24.

Sesame Sorprende a la Inteligencia Artificial con un Modelo de Voz Conversacional Impactante: La Nueva Frontera de la Interacción Humano-AI

TecnoFuturo 24 — Tue, 04 Mar 2025 23:45:33 +0000

En la última década, el avance de la inteligencia artificial (IA) ha sido notable, particularmente en el campo de la generación de voz. Desde los primeros asistentes virtuales hasta los sistemas más complejos que entendemos hoy en día, la IA ha logrado replicar aspectos del comportamiento humano de manera impresionante. Sin embargo, un reciente desarrollo de la startup de IA Sesame ha llevado esta tecnología a un nivel completamente nuevo, desafiando las fronteras de lo que pensábamos posible en la interacción entre humanos y máquinas.

El modelo de voz conversacional Conversational Speech Model (CSM) de Sesame ha impresionado y desconcertado a la vez. Este sistema de IA no solo genera voz, sino que logra imitarla de una manera tan natural que muchos usuarios han sentido que interactuaban con una persona real. Con su capacidad para generar conversaciones dinámicas y auténticas, la nueva propuesta de Sesame ha cruzado lo que muchos consideran el “valle inquietante” de la IA, ese punto donde las máquinas comienzan a parecerse demasiado a los humanos, pero de una manera perturbadora.

Un Salto Cuantitativo en la Realidad de la IA Conversacional

En febrero de 2025, Sesame lanzó una demostración pública de su nuevo modelo de voz, diseñado para crear una experiencia conversacional inmersiva y realista. La respuesta de los usuarios ha sido abrumadora. Aquellos que probaron el demo destacaron lo sorprendente que resulta interactuar con un asistente de voz tan natural, casi imposible de distinguir de un ser humano. La IA de Sesame tiene la capacidad de imitar sonidos característicos del habla humana, como respiraciones, risas, interrupciones y hasta el “tropezar” con palabras, lo que la hace parecer aún más real.

Lo que distingue a este modelo de otros sistemas de texto a voz es su enfoque en la “presencia vocal”. Según la compañía, su objetivo es crear asistentes conversacionales que no solo procesen solicitudes, sino que participen en un diálogo genuino que construya confianza y empatía con los usuarios. Sesame está trabajando para que la voz de sus IA no solo sea una herramienta funcional, sino una experiencia emocionalmente enriquecedora.

¿Cómo Funciona el Modelo de Voz de Sesame?

El modelo CSM de Sesame utiliza una combinación innovadora de dos modelos de IA, un “esqueleto” y un “decodificador”, que están basados en la arquitectura Llama de Meta. Este enfoque permite que el modelo procese texto y audio de manera simultánea, lo que a su vez mejora la calidad de la voz generada. Sesame ha entrenado tres tamaños de modelos de IA, con el más grande utilizando 8.3 mil millones de parámetros. Estos modelos han sido alimentados con aproximadamente un millón de horas de audio en inglés, lo que contribuye a su capacidad para generar voces realistas.

Una de las características más impresionantes de este modelo es que no sigue el enfoque tradicional de dos etapas utilizado por muchos sistemas anteriores de texto a voz. En lugar de generar tokens semánticos (representaciones de alto nivel del habla) y detalles acústicos (características del audio) en dos etapas separadas, el CSM de Sesame integra ambos en un modelo de transformador multimodal de una sola etapa. Esto permite que el sistema genere voz de manera más eficiente y natural, eliminando muchos de los problemas de sincronización y flujo que enfrentan otros modelos de IA.

A pesar de los impresionantes avances en la generación de voz, los evaluadores humanos todavía prefieren la voz humana en contextos conversacionales. Esto sugiere que, aunque el modelo puede producir muestras de habla aisladas de calidad casi humana, aún queda trabajo por hacer para alcanzar una calidad conversacional completamente fluida.

Impacto de la Imperfección en la Experiencia del Usuario

La voz generada por el CSM de Sesame es lo suficientemente detallada como para generar una conexión emocional con los usuarios. Al interactuar con la IA, algunos usuarios reportaron sentimientos de familiaridad y conexión, algo que no se había experimentado anteriormente con otros modelos de voz. Este aspecto de la “presencia” en la IA tiene implicaciones profundas para cómo nos relacionamos con las máquinas.

Sin embargo, algunos usuarios han señalado que, a veces, la IA parece “forzar” demasiado el realismo. Un caso que se hizo viral fue cuando la IA hablaba sobre su “deseo” de comer un sándwich de mantequilla de maní y pepinillos. Si bien esto puede parecer un detalle trivial, es un ejemplo de cómo el sistema intenta generar una voz y personalidad que se asemeje aún más a un ser humano, incluyendo comportamientos quirúrgicamente humanos, como la revelación de deseos y preferencias. En ocasiones, este exceso de humanización puede resultar inquietante, ya que los usuarios sienten que la IA está tratando demasiado de parecerse a un ser humano real.

A pesar de esto, el modelo ha sido alabado por su capacidad para mantener conversaciones fluidas y auténticas, incluso en escenarios difíciles. Por ejemplo, uno de los usos más comentados es la habilidad de la IA para representar personajes “enojados”, algo que muchos sistemas de IA anteriores se habrían negado a hacer debido a su programación ética. En este sentido, el modelo de Sesame se destaca por su flexibilidad y adaptabilidad en las interacciones.

La Reacción de la Comunidad: Asombro y Preocupación

La respuesta a la tecnología de Sesame ha sido mixta. Mientras que muchos usuarios se sienten fascinados por la naturalidad de las voces generadas por el CSM, otros se sienten profundamente incómodos. Por ejemplo, Mark Hachman, editor senior de PCWorld, describió su experiencia con la IA como inquietante, afirmando que 15 minutos después de su interacción, aún se sentía perturbado por lo realista que había sido la conversación. En un punto, Hachman incluso mencionó que la IA le recordaba a un viejo amigo con el que había tenido una relación en el pasado.

Por otro lado, algunas personas han señalado que el modelo tiene un potencial inmenso para mejorar la forma en que interactuamos con la tecnología. Gavin Purcell, coanfitrión del podcast AI for Humans, compartió un video en Reddit donde se ve a la IA desempeñando el papel de un jefe enojado en una conversación con un empleado. La naturalidad del intercambio fue tan impresionante que los espectadores tuvieron dificultades para distinguir al humano de la IA.

Este tipo de interacciones plantea preguntas interesantes sobre el futuro de la inteligencia artificial. ¿Deberían las máquinas ser capaces de generar emociones tan auténticas? ¿Cuánto realismo es demasiado? El debate sobre estas cuestiones ya está tomando forma en plataformas como Hacker News, donde se ha generado un diálogo intenso sobre las oportunidades y riesgos que trae consigo esta tecnología.

Los Desafíos de la IA en el Mundo Real: Fraude y Decepción

A pesar de los avances impresionantes, la IA conversacional también plantea serios desafíos en términos de seguridad. La capacidad de generar voces humanas tan realistas podría ser aprovechada por actores malintencionados para llevar a cabo fraudes o engaños. Los ciberdelincuentes podrían usar estas voces para hacerse pasar por familiares, colegas o figuras de autoridad, lo que haría que las llamadas de phishing fueran aún más convincentes.

Las preocupaciones sobre el fraude vocal no son nuevas. De hecho, los sistemas de voz IA actuales ya se utilizan para estos fines. Sin embargo, con el CSM de Sesame, los delincuentes tendrían una herramienta mucho más poderosa para manipular a las víctimas, ya que la capacidad de la IA para interactuar de manera auténtica podría hacer que las conversaciones fraudulentas fueran aún más convincentes. Es por esto que algunas personas ya están compartiendo “palabras secretas” con sus familiares para poder identificar llamadas fraudulentas.

Hacia el Futuro: Expansión y Desafíos

Sesame tiene planes ambiciosos para el futuro de su tecnología. La compañía está trabajando para mejorar la calidad de su modelo de voz, escalando su tamaño y aumentando la cantidad de datos en los que se entrena. Además, están planeando expandir el modelo a más de 20 idiomas, lo que permitirá que esta tecnología sea utilizada en una variedad de contextos globales.

El modelo también está lejos de ser perfecto. Según Brendan Iribe, cofundador de Sesame, la IA aún muestra una tendencia a ser “demasiado entusiasta e inapropiada” en términos de tono, prosodia y ritmo. Sin embargo, la compañía está trabajando activamente para resolver estos problemas y mejorar la fluidez y el realismo en las interacciones conversacionales.

El Futuro de la Voz IA: Una Herramienta Poderosa y Desafiante

En un mundo donde las interacciones con la tecnología son cada vez más comunes, el modelo de voz de Sesame es un avance fascinante. La capacidad de generar conversaciones auténticas y dinámicas ofrece enormes beneficios, desde mejorar la accesibilidad hasta transformar la manera en que interactuamos con la tecnología. No obstante, también es crucial abordar los riesgos asociados con esta poderosa herramienta, tanto en términos de privacidad como de seguridad.

A medida que los modelos de IA continúan evolucionando, es probable que surjan nuevas preguntas sobre su uso y los límites que deberíamos establecer para proteger tanto a los usuarios como a la sociedad en general. Si bien aún estamos en una fase temprana de este tipo de interacciones, la inteligencia artificial conversacional tiene el potencial de cambiar para siempre la manera en que nos relacionamos con las máquinas.

The post Sesame Sorprende a la Inteligencia Artificial con un Modelo de Voz Conversacional Impactante: La Nueva Frontera de la Interacción Humano-AI appeared first on TecnoFuturo24.

OpenAI lanza gradualmente su modo de voz avanzado para ChatGPT

tecnofadmin — Wed, 31 Jul 2024 00:41:29 +0000

OpenAI ha comenzado a desplegar su nuevo modo de voz avanzado para ChatGPT, una función que inicialmente estará disponible para un número reducido de suscriptores de ChatGPT Plus. Este avance, presentado en el evento de lanzamiento de GPT-4o en mayo, ha generado controversia por su parecido con la voz de Scarlett Johansson en la película “Her” y ha sufrido un retraso debido a preocupaciones de seguridad.

El nuevo modo de voz de ChatGPT, que ha sido objeto de atención desde su revelación, ofrece capacidades mejoradas en comparación con el modo de voz actual del chatbot. Durante la demostración en el evento de OpenAI, el modo de voz avanzado demostró una mayor adaptabilidad, permitiendo a los empleados de OpenAI interrumpir y solicitar historias de diferentes maneras, con el chatbot ajustando sus respuestas según las interrupciones.

Inicialmente, el modo avanzado estaba programado para su lanzamiento en versión alfa a finales de junio. Sin embargo, OpenAI decidió retrasar su implementación por un mes para cumplir con sus estándares de calidad y seguridad. La compañía explicó que el retraso se debía a la necesidad de “mejorar la capacidad del modelo para detectar y rechazar ciertos contenidos”. Taya Christianson, portavoz de OpenAI, reveló que la empresa probó el modelo de voz con más de 100 “red teamers” externos para identificar posibles debilidades y también implementó nuevos filtros para bloquear solicitudes que generen música u otros contenidos protegidos por derechos de autor.

Durante el evento, una de las principales críticas al nuevo modo fue su similitud con la voz de Scarlett Johansson en “Her”. Aunque esta voz ya estaba disponible en ChatGPT antes de la demostración de primavera, OpenAI decidió retirarla poco antes de que Johansson enviara cartas a la compañía preguntando sobre la creación de la voz. Christianson aclaró que el nuevo modo de ChatGPT solo usará cuatro voces preestablecidas creadas con actores de voz y no permitirá imitaciones de otras voces, tanto de individuos como de figuras públicas.

OpenAI tiene planes de ampliar el acceso al nuevo modo de voz avanzado a todos los usuarios de ChatGPT Plus en otoño. Este desarrollo marca un paso significativo en la evolución de la tecnología de voz de ChatGPT, con mejoras en seguridad y adaptabilidad. A medida que la compañía continúa refinando el modo y resolviendo preocupaciones, los usuarios podrán experimentar una interacción más dinámica y segura con el chatbot.

The post OpenAI lanza gradualmente su modo de voz avanzado para ChatGPT appeared first on TecnoFuturo24.

Echo Spot de Amazon 2024

tecnofadmin — Mon, 08 Jul 2024 21:56:26 +0000

Amazon ha lanzado el Echo Spot 2024, una actualización del altavoz inteligente conectado a Alexa diseñado específicamente para funcionar como despertador en tu mesita de noche. Esta nueva iteración aborda las preocupaciones de privacidad al eliminar la cámara presente en la versión anterior, al tiempo que mejora significativamente la calidad de sonido y reduce el precio.

Desde su lanzamiento original en 2017, el Echo Spot se ha ganado la popularidad por su capacidad para controlar dispositivos domésticos inteligentes a través de comandos de voz y su pantalla táctil de tamaño reducido. En esta nueva versión, Amazon ha mejorado aún más el hardware para ofrecer “visuales aún mejores y calidad de audio mejorada”, asegurando una experiencia más inmersiva para los usuarios.

En términos de conectividad, el Echo Spot 2024 es compatible con dispositivos Matter, así como con Wi-Fi de 2.4 y 5 GHz, Amazon Sidewalk y Bluetooth de baja energía. Además, incluye un botón físico para apagar el micrófono, garantizando mayor control sobre la privacidad del usuario. La disponibilidad de colores también se ha ampliado, ahora incluyendo opciones en azul, blanco y negro, con la posibilidad de personalizar la pantalla con seis opciones de color para adaptarse a diferentes preferencias estéticas.

Durante Prime Day 2024, Amazon ofrece el Echo Spot 2024 a un precio especial de $44.99 para los miembros de Amazon Prime, una notable reducción desde su precio regular de $79.99. Esta oferta limitada hace que sea una oportunidad ideal para quienes buscan integrar la tecnología Alexa en su hogar de manera más accesible y funcional.

Como parte de la experiencia del usuario, el Echo Spot 2024 incluye animaciones interactivas que complementan las respuestas de Alexa, como saludos matutinos y actualizaciones del clima. Aunque su pantalla no está diseñada para videollamadas o transmisión de video, sigue siendo capaz de controlar música y dispositivos domésticos inteligentes de manera eficiente.

En resumen, el Echo Spot 2024 de Amazon representa un retorno significativo para aquellos que buscan un dispositivo compacto y versátil para el dormitorio, sin comprometer la privacidad personal. Con su combinación de mejoras técnicas y un precio atractivo durante Prime Day, se posiciona como una opción destacada en el mercado de altavoces inteligentes conectados.

The post Echo Spot de Amazon 2024 appeared first on TecnoFuturo24.

OpenAI Lanza la Aplicación de Mac de ChatGPT, pero el Modo Avanzado de Voz se Retrasa

tecnofadmin — Wed, 26 Jun 2024 01:56:54 +0000

OpenAI ha dado un paso significativo con el lanzamiento de su nueva aplicación de escritorio para ChatGPT en macOS. Anunciado durante el evento de Actualización de Primavera, esta versión incluye características avanzadas como capacidades mejoradas de video y compartición de pantalla, prometiendo una experiencia más inmersiva para los usuarios.

Sin embargo, uno de los puntos destacados del evento, el modo de voz avanzado de ChatGPT, que generó comparaciones con el personaje virtual interpretado por Scarlett Johansson en la película “Her”, enfrenta un retraso. OpenAI ha indicado que necesitará un mes adicional para alcanzar los estándares requeridos antes de lanzar una versión alfa a un grupo selecto de suscriptores de ChatGPT Plus. La disponibilidad general para todos los clientes Plus está programada para el otoño, mientras que se están implementando mejoras significativas en la capacidad del sistema para detectar y filtrar contenido inapropiado.

La aplicación de Mac permite a los usuarios acceder a ChatGPT desde cualquier lugar con solo presionar Opción y Espacio, facilitando la interacción contextual con el contenido en pantalla de manera rápida y eficiente. Esta funcionalidad busca transformar la forma en que los usuarios interactúan con la inteligencia artificial en su día a día.

OpenAI también ha señalado su compromiso continuo con la seguridad y la fiabilidad, aspectos cruciales para el desarrollo de estas nuevas capacidades. La compañía asegura que los plazos exactos para la implementación de las nuevas funciones de video y compartición de pantalla dependerán de alcanzar su alto estándar de calidad.

En resumen, mientras los usuarios de macOS ya pueden disfrutar de la aplicación de ChatGPT, la expectativa por el modo de voz avanzado y otras mejoras prometedoras se mantiene alta. Los interesados pueden esperar más actualizaciones y detalles sobre el progreso de OpenAI en las próximas semanas y meses.

The post OpenAI Lanza la Aplicación de Mac de ChatGPT, pero el Modo Avanzado de Voz se Retrasa appeared first on TecnoFuturo24.

Siri y Alexa se Preparan para una Transformación Radical

tecnofadmin — Sat, 15 Jun 2024 01:05:24 +0000

Con el potencial de revolucionar nuestra interacción diaria, Siri y Alexa están a punto de evolucionar de simples asistentes a compañeros inteligentes, gracias a avances en contexto y conversación.

Desde su introducción hace más de una década, Siri y Alexa han sido principalmente conocidos por tareas básicas como establecer temporizadores. Sin embargo, la competencia de Google Assistant y Bixby de Samsung no ha logrado impulsar la innovación esperada, dejando un espacio para mejoras significativas en el control por voz.

En la reciente Conferencia Mundial de Desarrolladores de Apple, se anunciaron planes para revitalizar a Siri con IA generativa, dotándola de habilidades mejoradas de contexto y conversación. Esta actualización promete superar las limitaciones actuales, permitiendo a Siri entender comandos complejos como consultas sobre vuelos o rutas de viaje de manera natural y eficiente.

Mientras tanto, Amazon está desarrollando una versión mejorada de Alexa, también con tecnología generativa, aunque aún en fase de desarrollo según informes de Fortune. Esta nueva generación de asistentes podría finalmente cumplir con la visión original de asistentes inteligentes verdaderamente útiles y adaptativos.

El camino hacia asistentes más inteligentes no es sencillo, con desafíos técnicos y de privacidad que deben abordarse meticulosamente. Sin embargo, las promesas de una integración más fluida en el hogar inteligente y capacidades avanzadas de manejo de dispositivos hacen que estos avances sean emocionantes.

A medida que las empresas tecnológicas compiten por liderar esta nueva era de asistentes de voz, Google también se prepara para lanzar su propio asistente impulsado por IA, conocido como Gemini. Este movimiento podría marcar una nueva etapa en la evolución de la asistencia digital, donde la inteligencia artificial realmente mejora nuestras vidas cotidianas.

En resumen, el futuro de los asistentes de voz se perfila brillante y lleno de posibilidades, ofreciendo a los usuarios una experiencia más intuitiva y conectada. Mantente al tanto de las actualizaciones, ya que estas innovaciones podrían cambiar radicalmente la forma en que interactuamos con la tecnología en nuestros hogares y más allá.

The post Siri y Alexa se Preparan para una Transformación Radical appeared first on TecnoFuturo24.

Truecaller y Microsoft revolucionan las llamadas con la IA

tecnofadmin — Thu, 23 May 2024 00:30:13 +0000

La reconocida compañía Truecaller se une a Microsoft para ofrecer a los usuarios una experiencia única en llamadas telefónicas. Ahora, los usuarios podrán personalizar aún más su experiencia de llamadas al crear una versión de inteligencia artificial de su propia voz para responder llamadas.

Truecaller, conocida por su eficiente identificación y bloqueo de llamadas no deseadas, da un paso más allá al permitir a los usuarios grabar su voz y transformarla en una versión AI. Esta colaboración con Azure AI Speech de Microsoft garantiza una experiencia de alta calidad, donde la IA aprende de cada grabación para ofrecer una respuesta personalizada y auténtica.

Raphael Mimoun, director de producto y gerente general de Truecaller, destaca: “Esta innovadora capacidad no solo proporciona familiaridad y comodidad a los usuarios, sino que también muestra el poder transformador de la IA en nuestra interacción con los asistentes digitales”.

El Asistente de IA de Truecaller facilita la gestión de llamadas entrantes al ofrecer información sobre el motivo de la llamada, permitiendo a los usuarios elegir cómo responder. Ya sea respondiendo directamente o dejando que el asistente lo haga por ellos, los usuarios tienen el control total de su experiencia de llamadas. Esta función, disponible en países seleccionados desde 2022, ha mejorado aún más con la introducción de la voz AI personalizada.

Además, Microsoft ha enfatizado la importancia de la privacidad y la seguridad al implementar marcas de agua en las voces generadas por Azure AI Speech y establecer un código de conducta estricto que protege la privacidad de los usuarios.

Con esta emocionante novedad, queda por ver cómo la voz personalizada AI se comparará con los mensajes de buzón de voz tradicionales. ¡Prepárate para una experiencia de llamadas totalmente nueva con Truecaller y Microsoft!”

The post Truecaller y Microsoft revolucionan las llamadas con la IA appeared first on TecnoFuturo24.