OpenAI nos trae de cabeza desde hace casi dos años, cuando sorprendió al mundo entero con ChatGPT y cambió las reglas del juego en el sector de la tecnología. Después de muchos avances y de anunciar nuevos modelos de su IA, el pasado mes de mayo presentó la mayor de sus novedades: un modo de voz que intenta imitar la conversación natural que podrías tener con un amigo.
Tras de meses de espera y de ver después cómo empezaba a funcionar fuera de nuestras fronteras, ahora la compañía de Sam Altman ha anunciado la llegada del modo de voz avanzado de ChatGPT a todos los usuarios del plan Plus en España, así como en otros países de la Unión Europea, Suiza, Islandia, Noruega y Liechtenstein.
Esta esperada actualización, que empezó a desplegarse en verano, promete revolucionar la forma en que interactuamos con la inteligencia artificial, ofreciendo una experiencia más personalizada y natural. La pregunta es si realmente conseguirá una experiencia a lo 'Her' como tantos han vaticinado.
Well yes.
All Plus users in the EU, Switzerland, Iceland, Norway, and Liechtenstein now have access to Advanced Voice. https://t.co/AC6mdd1Lkf
— OpenAI (@OpenAI) October 22, 2024
Curiosamente —o no— el anuncio de OpenAI llega solo un día después de que Google lance Gemini Live en español, su IA conversacional, presentada en el Made by Google de este año.
9 voces distintas para hablar con ChatGPT
Ya sabíamos por algunas filtraciones previas que este modo de voz avanzado tiene varias voces entre las que elegir. Concretamente en España podemos elegir entre nueve distintas.
Breeze, Arbor, Spruce, Maple, Juniper, Sol, Cove, Ember y Vale son los nombres de las voces que puedes seleccionar. El tono varía entre más o menos neutrales, pasando por voces muy expresivas, otras más suaves, otras más energéticas y otras más profundas.
¿Qué es el modo de voz avanzado de ChatGPT?
El nuevo modo de voz avanzado quiere ir un paso más allá en la 'humanización' de las conversaciones con ChatGPT, añadiendo una serie de funciones que en teoría mejoran tanto la fluidez como la personalización en la interacción con el chatbot.
Una de las características que más destaca OpenAI —así como otras compañías como Google que también tienen modo de voz en sus modelos de IA— es la posibilidad de interrumpir sus respuestas en tiempo real a través de comandos de voz, haciendo que sea más similar a una interacción humana.
Además, esta nueva versión de ChatGPT incluye una función de memoria, que permite al asistente recordar conversaciones anteriores, lo que optimiza las interacciones en función del contexto previo del usuario. La idea es no tener que volver a explicar detalles sobre algo que ya has 'hablado' con la plataforma de IA y otros fabricantes, como Meta, también están trabajando en esa línea: esta misma semana conocíamos que WhatsApp trabaja en una función para recordar todo lo que escribes en la aplicación.
Otra novedad importante es que con las mejoras asociadas ChatGPT tiene la capacidad de interpretar emociones basadas en el tono de voz del usuario. Esto significa que el modelo puede ajustar sus respuestas según perciba frustración, entusiasmo o cualquier otro matiz emocional y, de esta manera, ser más empático —todo lo que puede serlo hoy en día una máquina—.
¿Cómo activar el modo de voz avanzado de ChatGPT?
Para acceder al modo de voz avanzado de ChatGPT solo tienes que abrir la aplicación en tu smartphone, Android o iOS, y cuando estés en un nuevo chat presionar en el icono de la onda de voz.
La plataforma te dará la bienvenida al nuevo servicio y te dará a elegir entre las voces disponibles —como hemos dicho, hay un total de nueve—. Cuando elijas una, presiona 'Empezar' y después dale permiso a la app para acceder al micrófono. Una vez realizados estos pasos solo tienes que hablar con ChatGPT y la IA te contestará.
Las polémicas del modo de voz de ChatGPT
Como muchos de los productos y las innovaciones que ha ido anunciando la compañía de Altman, cuando se dio a conocer el modo de voz de ChatGPT la función causó bastante revuelo. En este caso la polémica giró a su asombroso parecido con la voz de Scarlett Johansson en la película 'Her', algo que precisamente —y como decíamos— trata de imitar de alguna forma este nuevo servicio de OpenAI.
Aquella crisis se saldó de manera tajante: “Hemos escuchado preguntas sobre cómo elegimos las voces en ChatGPT, especialmente Sky. Estamos trabajando para suspender el uso de Sky mientras los abordamos”, informaba OpenAI en su cuenta de X (Twitter).
We’ve heard questions about how we chose the voices in ChatGPT, especially Sky. We are working to pause the use of Sky while we address them.
Read more about how we chose these voices: https://t.co/R8wwZjU36L
— OpenAI (@OpenAI) May 20, 2024