La nueva gran apuesta de las tecnológicas son los modelos de inteligencia artificial con capacidades de razonamiento. OpenAI se adelantó con o1, y ahora Google le ha seguido los pasos con una nueva versión de Gemini 2.0.
Se trata de Gemini 2.0 Flash Thinking Experimental, una IA que, como bien lo indica su nombre, aún se encuentra en fase experimental, pero que ya se puede probar de forma gratis a través de AI Studio.
A diferencia de otros modelos de inteligencia artificial que utilizan métodos predictivos para generar sus respuestas, los que tienen capacidades de razonamiento utilizan una metodología que les permite "pensar" sus contestaciones con el objetivo de que sean lo más certeras posible.
Según Logan Kilpatrick, líder de AI Studio, Gemini 2.0 Flash Thinking Experimental puede realizar planes y resolver problemas complejos en propio tiempo usando pistas tanto visuales como de imagen. En una breve demostración que el susodicho compartió a través de X (Twitter), se ve a la IA resolviendo una consulta y mostrando los diferentes enfoques analizados hasta llegar a la respuesta final.
Como todavía se trata de un modelo experimental, su funcionamiento está lejos de ser perfecto. Aquellos que quieren probarlo pueden hacerlo de forma gratuita a través de este enlace o por medio de la API de Gemini.
Gemini 2.0 ahora tiene una versión con capacidades de razonamiento
Desde que OpenAI anunció o1 en septiembre, el interés por los modelos con capacidades de razonamiento se ha disparado. Los trabajos de Google con este tipo de inteligencia artificial se reportaron a comienzos de octubre, cuando se dijo que la compañía estaba trabajando en una tecnología similar a la de la compañía de Sam Altman. Por entonces se indicó que los de Mountain View estaban trabajando en una metodología conocida como instrucciones de cadena de pensamiento.
Jeff Dean, uno de los científicos más importantes de DeepMind, remarcó en X (Twitter) que la nueva versión de Gemini 2.0 destaca por "mostrar explícitamente" sus pensamientos. Además, incluye un contador de tiempo que muestra cuánto demora en ofrecer una solución a lo que se le consulta. "Construido sobre la velocidad y el rendimiento de Flash 2.0, este modelo está entrenado para usar los pensamientos para fortalecer su razonamiento", agregó.
El objetivo que persiguen las grandes tecnológicas con este tipo de modelos es acabar con las alucinaciones o, como mínimo, reducirlas drásticamente. Tengamos en cuenta que las IA que utilizan métodos predictivos para sus respuestas son muy propensas a inventarse las contestaciones cuando tienen que lidiar con temas sobre los que no tienen demasiados datos en sus sets de entrenamiento.
Las inteligencias artificiales con capacidades de razonamiento suelen ser más lentas a la hora de ofrecer una respuesta, debido a los pasos adicionales para "pensar" sus contestaciones y contrastarlas con otras posibilidades. Pero, en teoría, ganan en certeza. Sin embargo, también existen dudas sobre si este tipo de tecnologías son lo suficientemente escalables, considerando que son más caras y requieren de un mayor poder de cómputo. Habrá que ver cómo evoluciona esta variante de Gemini 2.0, y si logra hacerle sombra a o1, que ahora tiene una versión más potente integrada en ChatGPT Pro.