Banner Edicion Impresa

Monitor Software


ChatGPT aprende a hablar, escuchar y ver

ChatGPT aprende a hablar, escuchar y ver
OpenAI actualiza su modelo de lenguaje para recibir comandos de voz e imágenes y responder con voz en lugar de texto

Publicación:02-10-2023
++--

ChatGPT se ha convertido en menos de un año en la herramienta de inteligencia artificial más conocida del mundo.

Madrid, España.- Con cientos de millones de usuarios registrados, este chatbot, desarrollado por OpenAI, puede responder cualquier pregunta formulada en lenguaje natural o inventar textos a partir de unas pocas directrices usando cualquier estilo imaginable.

Pero, a partir de ahora, será capaz también de hablar, escuchar y ver. La última versión de la herramienta, tanto en su versión web como en las apps para dispositivos móviles, añade la posibilidad de utilizar imágenes y voz para formular las diferentes preguntas.

ChatGPT, además, podrá a partir de ahora dar respuestas no sólo como un bloque de texto sino en voz alta, utilizando cinco voces creadas, cómo no, con inteligencia artificial. Esto permitirá, por primera vez, mantener una conversación natural con este modelo largo de lenguaje -que es como se conoce la tecnología que hace posible a ChatGPT crear respuestas que parecen escritas por una persona-.

Es, eso sí, una experiencia bastante más lenta que hablar con una persona real. La respuesta a una pregunta puede llegar tras varios segundos de incómodo silencio, de forma parecida a lo que ocurre con las respuestas de texto.

Gracias a estas nuevas habilidades, sin embargo, a partir de ahora será posible usar CHatGPT en una mayor variedad de situaciones. La aplicación, por ejemplo, podrá identificar las diferentes partes de una bicicleta en una imagen, y ayudar al dueño a ajustar o arreglar algo que se haya roto. También podrá comentar los diferentes puntos de interés de un paisaje o recomendar diferentes recetas tan sólo analizando una foto de lo que hay en el interior del frigorífico.

Las nuevas funciones están de momento restringidas a un pequeño grupo de usuarios y son exclusivas de quienes pagan por el servicio ChatGPT Plus o la versión para empresas de la aplicación. Según la compañía, el acceso se irá ampliando en las próximas semanas entre los suscriptores, aunque herramientas como las voces sintéticas estarán disponibles en un primer momento sólo en inglés.

Estas nuevas funciones también permitirán a terceras ofrecer nuevos servicios. Spotify, por ejemplo, acaba de comenzar la prueba piloto de un servicio de traducción instantánea de podcasts utilizando la propia voz de los presentadores.

Desde la empresa, sin embargo, señalan que estas nuevas formas de interacción no mejoran necesariamente la fiabilidad de las repuestas, uno de los problemas de este tipo de herramientas, ya que pueden, en ocasiones, inventarse los datos que no conoce para dar coherencia al texto final. "Somos transparentes sobre las limitaciones del modelo y desaconsejamos el uso de mayor riesgo, como la información especializada, sin una verificación adicional", explican desde OpenAI.



« Especial »