ChatGPT da un paso más, incorpora función con voz en iOS y Android

En esta ocasión, apuesta por el lanzamiento de ´ChatGPT con voz´, ya disponible para los usuarios gratuitos de la aplicación ChatGPT.


Con una valoración de más de 80.000 millones de dólares en octubre y millones de usuarios en todo el mundo, OpenAI mantiene su instinto de innovación y desarrollo de nuevas funcionalidades. 

ChatGPT con voz irrumpió en el mercado en septiembre para usuarios de pago, pero ahora estará disponible para todos los usuarios de iOS y Android sin excepción. A partir de ahora, la herramienta podrá ofrecer respuestas habladas mediante cualquiera de las cinco voces que se han creado con IA.

La nueva funcionalidad de ChatGPT es un paso de gigante hacia el futuro, que implica utilizar asistentes de voz en modelos de lenguaje grande. Su respuesta suele ser más extensa que la de un asistente de voz convencional, estando conformada por unas 66 palabras que expresará en una media de 23 segundos, tras unos pocos segundos de silencio que se toma para pensar.

Google y Amazon ya están trabajando en la actualización de sus asistentes de voz para utilizar modelos de lenguaje grandes, pese a las similitudes con los asistentes ya existentes en el mercado. No obstante, a diferencia de éstos, la nueva funcionalidad de ChatGPT con voz servirá únicamente para un sistema de preguntas y respuestas, pero no para operaciones complejas como realizar una llamada inteligente o programar una cita en el calendario.

El hándicap de ChatGPT con voz

Si bien es cierto que, pese a que es capaz de describir escenarios con pleno detalle, ChatGPT aún se encuentra en fase de implementación en los dispositivos, ya que podemos encontrar teléfonos de Android en los que aún no aparezca el icono de los ´auriculares´ aunque se tratase de una versión Plus de pago.

En principio, solo estaba disponible en su versión en inglés, pero paulatinamente ha ido incorporando nuevos idiomas como el español, al igual que su versión escrita. Además, desde OpenAI aseguran que  se trata de una funcionalidad en fase de desarrollo, por lo que se recomienda supervisar la información especializada que ofrece la herramienta.

Cómo usar ChatGPT con voz

Mediante ChatGPT con voz se podrán analizar una enorme variedad de situaciones, desde identificar las partes de una imagen hasta recomendar recetas tras analizar una foto.

El chatbot es accesible desde el teléfono, sin necesidad de abrir la web o contar con una interfaz adaptada. No obstante, la aplicación es la única que presenta el icono de un micrófono o de ondas sonoras (en el caso del iPhone).

El reconocimiento por voz del sistema operativo es aplicable en ordenadores y móviles. Para comunicarse con ChatGPT mediante voz en Windows 11 habrá que entrar en la web de ChatGPT desde cualquier ordenador y con el atajo de teclado Windows + H se iniciará el reconocimiento por voz. Tras hablar, habrá que volver a presionar el mismo atajo para pausar el reconocimiento por voz. En Android también es posible hablar con el chatbot gracias al reconocimiento por voz que incluye Gboard y en Apple gracias a macOS.

Otra fórmula para controlar el chatbot de OpenAI a través de la voz será la instalación de Voice Control for ChatGPT, una extensión gratuita que es compatible tanto con Edge como con Chrome. Una vez instalada, en la web de ChatGPT aparecerán nuevos controles, entre ellos, un icono de micrófono que permitirá seleccionar el idioma de entrada y de salida. Gracias a esta extensión, el chatbot será capaz de leer la respuesta en voz alta, permitiéndose por primera vez comunicaciones bidireccionales entre asistente y usuario.

También es posible acceder a la tecnología más avanzada de ChatGPT de forma gratuita mediante Bing Chat, ya que este chatbot está basado en GPT-4. En el extremo derecho del campo de texto de la herramienta aparecerá el icono de un micrófono para el reconocimiento automático de la voz, sin necesidad de instalar extensiones. Recordar que Bing Chat se encuentra disponible también a través de aplicación oficial en iPhone y Android.

Semanas de tensión para OpenAI

Al igual que el pasado 17 de noviembre se conociese la noticia de que OpenAI despedía de forma repentina y dramática a Sam Altman, cofundador de la entidad, alegando a cuestiones de pérdida de confianza, solo tres días más tarde Microsoft anunció la contratación de Altman para liderar un nuevo equipo de investigación avanzada.

Pero los movimientos siguieron, y en un contexto caótico, OpenAI anunció solo 48 horas después el regreso de Altman como director ejecutivo. Actualmente es considerado un referente en IA para muchos líderes mundiales, ya que siempre se ha caracterizado por saber atraer a fuertes inversionistas para financiar sus proyectos.