Google anuncia Gemini Pro

Han sido varios meses de rumores, pero finalmente se ha oficializado el lanzamiento del último modelo de IA de Google, Gemini, en su versión Pro.


Está pesada para desarrolladores y organizaciones, integrándose plenamente en los servicios de Google AI Studio y de Google Cloud Vertex AI.

Gemini Pro ha sido diseñado para ser más potente, multimodal y flexible, por lo que podrá comprender, operar y combinar diferentes tipos de información (texto, código, audio, imagen y video). Se podrá emplear tanto en centros de datos como en dispositivos móviles.

Su disponibilidad

La API de Gemini Pro a desarrolladores estará disponible y gratis hasta el próximo año. Se presenta en tres niveles de uso (Ultra, Pro y Nano). Gemini Pro, ya en Bard, permite ofrecer una versión mejorada del chatbot mediante un razonamiento, comprensión y planificación más avanzados, escalando una amplia gama de tareas.

Por su parte, Gemini Nano es la versión más eficiente para tareas de dispositivo, mientras que Gemini Ultra es el modelo más potente y está orientado a cuestiones complejas.

Una vez se acabe su periodo de prueba, habrá que abonar una cantidad irrisoria de 0,00025 dólares por cada 1.000 palabras o 0,0025 dólares por cada imagen de entrada y de salida 0,0005 por la misma cantidad de palabras. No obstante, no existe imagen de salida por el momento.

Presencia en Google AI Studio

Las capacidades de Gemini permitirán a estudios de desarrollo y a desarrolladores individuales crear aplicaciones mediante una herramienta web fácil de usar y 100% eficiente. Al ser Google AI Studio un aliado gratuito para el desarrollo de código, ahora se verá especialmente potenciado por Gemini Po.

Se podrán generar prompts que ayudasen a crear código. Hay que recordar que Google AI Studio ofrece una cuota gratuita de hasta 60 peticiones por minuto, ofreciendo una operatividad mayor que otros servicios similares. Además, el código generado podrá posteriormente transferirse al entorno de desarrollo integrado que se desease.

Presencia en Google Cloud Vertex AI

Aquí podrán utilizar las capacidades de Gemini Pro para crear agentes e integrar la IA en sus aplicaciones. Mediante esta plataforma podrán acceder a más de 130 modelos de código abierto, tanto de Google como de terceros.

Se garantiza un soporte integral para Gemini Pro mediante nuevas herramientas que aseguran la personalización de los agentes con datos propios y el aprendizaje por refuerzo con feedback humano y destilación.

De igual manera, se incluyen herramientas de aumento para que los desarrolladores puedan recuperar, comprender e interaccionar con la información del mundo real a través de bloques configurables de generación aumentada de recuperación y extensiones. También habrá herramientas de verificación de la calidad de la información, así como controles exhaustivos de seguridad.

Su integración en Cloud Vertex AI se encuentra ya disponible, siendo el objetivo de cara a 2024, extenderlo a Vertex AI Search y Conversation, capaces de crear agentes avanzados de búsqueda y conversación con un enfoque de poco código de programación.

Su irrupción en Vertex AI Search supondrá obtener resúmenes, respuestas, datos multimodales y numerosas fuentes para búsquedas. En el caso de Vertex Conversation, Gemini facilitará las conversaciones multimodal y multicanal.

Disponibilidad en Duet AI

Gemini irrumpirá en este servicio para trabajar en Google Worspace y Google Cloud. De este modo, los usuarios podrán programar de manera más ágil gracias a funciones como la de completar el código con IA, generar código de programación y chat en varios entornos de desarrollo integrado (IDE).

Además de agilizar las tareas y los procesos repetitivos de los desarrolladores con atajos para tareas comunes, permitirá agilizar el aprendizaje basado en competencias. Se brinda a los usuarios la posibilidad de formular preguntas mediante un chat en lenguaje natural. Estas funcionalidades son para Duet AI for Developers.

En el caso de Duet AI in Chronicle Segurity Operations (plataforma unificada de operaciones de seguridad de Google Cloud), los usuarios podrán realizar búsquedas en grandes volúmenes de datos en cuestión de segundos mediante consultas generadas a partir del lenguaje natural y dar respuesta a incidentes. Se prevé que Duet AI se amplíe a BigQuery, Apigee y Looker próximamente.

AI Hypercomputer y el acelerador TPU

Cloud TPU v5p se muestra como un acelerador de IA flexible cuatro veces más escalable que TPU v4p en términos de FLOP disponibles por pod. Por su parte, AI Hypercomputer es una revolucionaria arquitectura de superordenador, que utiliza un sistema integrado de hardware de rendimiento optimizado, un software abierto y modelos de consumo flexibles.

También se ha presentado una versión mejorada de Imagen 2. Mejorándose con funciones de fotorrealismo, renderizado de texto y generación de logotipos. También se ha anunciado la disponibilidad de MedLM, un paquete de modelos e interfaces de programación de aplicaciones (API) adaptados a aplicaciones médicas. Estará disponible en Vertex AI.