GPT-4: el gran salto adelante de la IA generativa de OpenAI

También los modelos de lenguaje que utilizan los que funcionan mediante texto, bien como medio para las peticiones que reciben los sistemas, como para devolver las respuestas y resultados a estas peticiones. De ellos, el más popular, quizá, es GPT, un modelo grande de lenguaje capaz de imitar el escrito de los humanos, así como su razonamiento.

Este modelo es capaz de hacer todo esto gracias a que se ha entrenado con una gran cantidad de comunicación y y textos escritos por humanos. Desde obras de literatura clásica hasta mensajes y textos recopilados en Internet. GPT es un tipo de modelo de IA que basa su funcionamiento en predecir qué letra, número o carácter sigue al que ya ha aparecido.

En la actualidad, su creador, la compañía OpenAI, ya ha lanzado su versión 4, aunque en ciertos sistemas, como la versión gratuita del sistema de IA generativa ChatGPT, sigue manteniendo la 3.5. GPT-4 supone un salto de gigante con respecto a las versiones anteriores del modelo, como veremos a continuación.

GPT-4: qué es y precios de acceso

GPT-4 es la cuarta generación del modelo fundacional GPT, y es ya un modelo multimodal capaz de crear no solo texto, sino también obras de arte, vídeo o sonido, tal como lo hacen los humanos. Además, es capaz de solucionar problemas que se le suministran por escrito de manera más elaborada que GPT-3 y GPT 3.5. También es capaz de solucionar problemas mucho más complejos que versiones anteriores de GPT.

Su lanzamiento se hizo oficial el pasado 14 de marzo de 2023, y su disponibilidad a través de la versión de pago de ChatGPT, por un precio de 20 dólares mensuales para usuarios particulares. Las empresas que deseen utilizar ChatGPT Plus tienen que apuntarse para solicitar acceso a través de una lista de espera. Aún así, su acceso es limitado, y por ejemplo, OpenAI todavía no ha dado apenas acceso a a empresas a las funciones del modelo relacionadas con el terreno visual. Para utilizar su API para integrarlo en sus productos, tienen que apuntarse en esta lista.

Los precios de la API de solo texto de CPT-4 parten de los 0,03 dólares por cada 1.000 tokens, cada uno de ellos de unos cuatro caracteres en inglés, de prompt. El precio de los tokens de salida parte de los 0,06 dólares por cada millar. Aproximadamente, un token equivale a unas 75 palabras, de media. OpenAI ofrece más detalles sobre cómo contabiliza los tokens, y lo que son, en esta página.

Además, Open AI ya tiene planes de lanzar un nuevo plan de suscripción para quienes utilizan GPT-4 con bastante frecuencia, además de un portal de acceso gratuito a GPT-4. Eso sí, con limitaciones, ya que solo permitirá hacer un número limitado de preguntas y peticiones a sus usuarios. Pero todavía habrá que esperar hasta que esté disponible, puesto que OpenAI no ha facilitado todavía plazos ni fechas para su disponibilidad. Mientras tanto, los usuarios de la versión gratuita de ChatGPT siguen utilizando un sistema que incorpora GPT-3.5.

Lo que permite hacer este modelo

El principal uso de GPT-4, como el de sus predecesores, es responder a preguntas realizadas en lenguaje natural a través de texto, así como de a otras peticiones similares. Según sus creadores, es capaz de seguir instrucciones complejas en lenguaje natural, así com de solucionar problemas complicados con un nivel elevado de precisión. Una precisión que además es muy superior a la que puede alcanzar el modelo con versiones anteriores.

En concreto, GPT-4 es capaz de resolver problemas matemáticos, responder preguntas, contar historias o sacar conclusiones a partir de varias premisas que se le faciliten. También es capaz de generar resúmenes de textos y contenidos de cierta extensión, lo que puede ser útil, por ejemplo, para resumir ponencias o hacer una síntesis de los resultados observados durante la visita de un médico a un paciente. Estos son solo dos de los posibles casos de uso que pueden identificarse para GPT-4.

Además, GPT-4 ha sido capaz de conseguir puntuaciones más elevadas que GPT-3.5 y otras versiones en diversas pruebas. Gracias a su capacidad de repetir información en un orden coherente ha conseguido, por ejemplo, puntuaciones que rondan el 90% de aciertos en el Examen de ejercicio de la abogacía de Estados Unidos, y del 93% en la prueba de SAT de Lectura y escritura basada. en evidencias.

Eso sí, hay que tener en cuenta que estos test no miden el conocimiento general del modelo. Lo que se consigue al ejecutar GPT-4 para que conteste a las preguntas de pruebas que están estandarizadas es la capacidad del modelo para generar respuestas que parecen correctas, generadas a partir de todos los datos e información con los que se le ha entrenado.

Las limitaciones que todavía tiene GPT-4

A pesar de que GPT-4 permite conseguir más respuestas, y con más variedad y precisión, que las versiones anteriores del modelo, hay bastantes cosas que todavía no es capaz de hacer. Por ejemplo, no comprueba que todo lo que dice sea cierto, lo que da lugar a fallos. Además, debido a su entrenamiento, puede que sus respuestas no tengan sentido, e incluso que lo que diga pueda generar polémica por tratarse de afirmaciones controvertidas.

Para evitar esto último, OpenAI cuenta con controles digitales, así como con entrenadores humanos, para intentar que las respuestas del modelo sean útiles, y lo más apropiadas para uso empresarial posible.

Además, GPT-4 tiende a generar en muchos casos lo que se conoce como alucinaciones. Con este término, en el caso de los modelos de lenguaje, nos referimos a respuestas imprecisas o erróneas. En estos casos, las palabras y frases que devuelve como respuesta a una petición o pregunta tienen sentido dentro de la frase.

Esto se debe a que están basadas en probabilidades establecidas por la manera en la que se ha entrenado el sistema. Pero no están conectadas con sucesos reales, ni se ha comprobado su certeza. De hecho, las alucinaciones de GPT-4, en muchos casos, son frases correctamente compuestas, pero en muchos casos sin sentido, o con fallos de cierto peso. En la actualidad, OpenAI está trabajando para reducir el número de afirmaciones falsas que genera el modelo como respuesta.

Otra de las limitaciones principales del modelo es la falta de claridad de OpenAI con respecto a si la información corporativa sensible que se suministra a GPT-4 se empleará en otras ocasiones para entrenar el modelo, y por tanto quedará expuesta a terceros. Microsoft, por ejemplo, que tiene un acuerdo de reventa con OpenAI, planea ofrecer instancias privadas de ChatGPT con GPT-4 a empresas a corto plazo. Por lo tanto, para entonces será importante contar con información al respecto, y para muchas empresas, con la seguridad de que la información que aportan al modelo no está accesible a terceros.

Por otra parte, tal como sucede con GPT-3.5, GPT-4 no cuenta con información posterior a los últimos meses de 2021 en su base de conocimientos. Es una limitación importante del modelo con respecto a otros competidores. Es el caso de Bard de Google, que tiene información reciente porque para entrenarlo se han usado datos e información prácticamente hasta la actualidad.

GPT-4 frente a ChatGPT

GPT-4 ofrece una cantidad de conocimiento mayor que la de GPT-3.5, el modelo que incorpora ChatGPT. Eso sí, no se sabe hasta qué punto, puesto que OpenAI no ha desvelado el tamaño del modelo utilizado para entrenar a GPT-4. Lo único que han asegurado es que tiene más datos y computación que los miles de millones de parámetros utilizados para entrenar a ChatGPT:

El modelo GPT-4 ha demostrado una habilidad mayor que ChatGPT en la redacción de una mayor variedad de contenidos. Entre ellos, textos de ficción. Esta última versión de GPT también ha conseguido mayores puntuaciones que ChatGPT, en pruebas estandarizadas, como hemos mencionado. Además, las respuestas a las peticiones suministradas al modelo suelen ser más concisas, y más sencillas de analizar.

Esta versión del modelo es mejor también que la anterior, y por tanto que Chap GPT, en tomar decisiones de importancia para las empresas, como la planificación o los resúmenes. GPT-4 es, según OpenAI, responde un 82% menos de veces a peticiones de contenido no permitido, y cuenta con un 40% más de probabilidad de generar respuestas basadas en hechos.

Pero sin duda, uno de sus principales avances es que GPT-4 puede trabajar con imágenes y contenido visual. Puede servir, gracias a eso, como apoyo visual, describiendo objetos del mundo real, entre otras aplicaciones. Por eso, GPT-4 es sin duda un salto adelante en el campo de los modelos grandes de lenguaje. Por ahora, solo es posible acceder a él abonando una cantidad o a través de aplicaciones de empresas asociadas a OpenAI. Pero no tardaremos mucho, probablemente, en poder ver todo su potencial.