Monitor Software
¿Qué puedes hacer con Google Gemini?
Publicación:24-02-2024
TEMA: #Software
Los del buscador han adoptado un enfoque similar al que ha seguido Microsoft desde septiembre, cuando oficializó que sus propuestas basadas en Prometheus.
Ya han pasado unas semanas desde que Google diera el salto de Bard a Gemini, que ya cuenta con su propia dirección (a la que serás redirigido si intentas acceder a Bard), confirmando así lo que muchos esperábamos desde que la empresa presentara su LLM, del mismo nombre, a principios de diciembre. De este modo, los del buscador han adoptado un enfoque similar al que ha seguido Microsoft desde septiembre, cuando oficializó que sus propuestas basadas en Prometheus (la variante de GPT personalizada por los de Redmond) bajo la enseña de Copilot.
Además, para demostrar que van muy, muy en serio con este mercado, apenas una semana después de este cambio, Google nos anunciaba la llegada de la primera evolución del LLM, Gemini 1.5, que según afirman supone una enorme mejora tanto en rendimiento como en eficiencia, al punto de que la versión Pro (el modelo intermedio, que motoriza la versión gratuita del servicio de chatbot) ofrece el mismo rendimiento que la variante Ultra de la versión 1.0, y además lo hace con un menor consumo eléctrico en cada inferencia, gracias a la adopción de una técnica denominada Mixture of Experts (MoE), que permite activar solo determinadas partes del modelo para cada inferencia.
Todavía queda mucho margen de evolución, eso está claro, es bastante sencillo encontrar respuestas erróneas no solo en Gemini, sino en cualquiera de estos chatbots y en otros tipos de modelos generativos. No obstante, es indudable que nos encontramos frente a una tecnología revolucionaria, que va a cambiar muchas cosas, y que no dejará de evolucionar ni a corto ni a medio plazo, logrando en el futuro que aquello que hoy ya nos parece más que bueno se quede muy corto en comparación.
Ahora bien, aunque algunos ya hemos dedicado muchísimas horas a explorar las opciones de Gemini y similares, siguen siendo muchas las personas que todavía no tienen claro qué es lo que se puede hacer con estos chatbots. Y es comprensible tanto por el hecho de que todavía son servicios bastante novedosos, como porque sus interfaces, adecuadamente dadas a la limpieza y el minimalismo, al final sí que resultan menos informativas de lo que algunas personas desearían. Y no me tengo que ir muy lejos, pues incluso en mi entorno más cercano me he encontrado con la pregunta "¿Qué puedo hacer con Gemini?" en más de una ocasión. Para que quede más claro, vamos a ver algunas posibilidades:
Escribir un documento formal
Imagina que tienes que escribir un documento, de un estilo con el que no estás familiarizado en absoluto. Puedes lanzarte a la búsqueda de ejemplos en Internet, descargarte plantillas, dedicar un buen rato solo a la fase de documentación previa... en fin, que puedes terminar invirtiendo unas cuantas horas en una tarea que preferirías no tener que llevar a cabo.
O, claro, puedes pedirle a Gemini que lo haga por ti, como en la imagen superior, en la que puedes ver tanto el prompt que he empleado como la respuesta obtenida. Obviamente, y esto es aplicable en otros muchos casos, lo que te ofrece el servicio puede ser el punto de partida o el punto final. Si lo consideras necesario, puedes editar el texto, pero si tal y como te lo ofrece ya te resulta satisfactorio... pues no le des más vueltas, utilízalo tal y como necesitabas y a otra cosa.
Identificar imágenes
Hay un concepto que se repite con frecuencia al hablar de este tipo de servicios, y es el de "multimodal", que no es otra cosa que el soporte, por parte del mismo, de distintos formatos de entrada, siendo imagen y texto (ya sea escrito o "hablado") los más comunes. Así, puedes crear un prompt que albergue una imagen, y texto en el que indiques qué es lo que quieres que haga en relación con esa imagen.
Esto, claro, dependerá del tipo de servicio que sea y el tipo de salida que deseas obtener. Así, en uno de creación de imágenes, puedes utilizar una imagen e indicar, mediante texto, si deseas que haga algo parecido, que tome algún elemento en concreto de la misma, si quieres que la reproduzca pero con otro estilo... la lista de posibilidades es, ya lo puedes imaginar, prácticamente interminable.
En el caso de un chatbot como Gemini, y como has podido ver en la captura que encabeza este apartado, un uso muy interesante es crear un prompt subiendo una imagen y pidiendo al modelo que te explique qué contiene la misma. En el ejemplo, como habrás comprobado, he subido nuestro logo y le he preguntado al chatbot y, bueno, ya has visto la respuesta, con análisis de tipografía y color incluidos.
Crear una fórmula de Excel
Ya hay servicios diseñados específicamente para este fin, como el que te contamos aquí y, si trabajas habitualmente con Excel, es probable que esa sea tu mejor opción. SIn embargo, si haces un uso más esporádico de la herramienta, probablemente te resulte más conveniente utilizar un servicio como Gemini. Eso sí, y precisamente por eso he puesto este ejemplo, en ocasiones debes ser un poco insistente hasta obtener el resultado deseado.
Como puedes ver en la imagen superior, le he pedido al chatbot una fórmula para obtener el resultado que quería, pero en vez de eso lo que ha hecho es darme los elementos para que pueda construirla yo mismo. Nada que objetar desde el plano teórico, en verdad en vez de darme un pescado me está dando la caña y me está enseñando a usarla, lo que me parece loable.
Pero es que yo no quiero aprender a pescar en este momento, yo ahora quiero la fórmula, así que lo que he hecho ha sido insistir
Y ahora sí, como puedes ver, ya me ha facilitado la fórmula... solo que no es correcta, ya que como elemento separador de los elementos de la concatenación ha puesto una coma, cuando en realidad esa función la lleva a cabo el punto y coma. No pasa nada, se lo recuerdo
Además, ya que estoy he aprovechado para darle un par de indicaciones más relacionadas con el estilo que quiero que tenga la salida de la fórmula, y esto es lo que me ha sugerido:
=CONCATENAR(«Valor mínimo: ";TEXTO(MIN(A1:A1000);"0.00");"; Valor máximo: ";TEXTO(MAX(A1:A1000);"0.00");"; Media: «;TEXTO(PROMEDIO(A1:A1000);"0.00"))
Con este ejemplo quiero mostrar una utilidad más de Gemini, claro, pero también poner el foco en que los buenos usuarios son como los buenos periodistas al hacer una entrevista: si la primera respuesta no es satisfactoria, hay que repreguntar una y las veces que resulte necesario hasta llegar al punto deseado.
Diamantes en Minecraft
La netherita le robó a los diamantes el rol de mineral más difícil de encontrar. Sin embargo, en muchos casos la netherita solo resulta útil cuando se combina con elementos creados con diamante, de modo que éstos siguen jugando un papel imprescindible en el juego. Ahora bien, ¿dónde se encuentran los diamantes?
Aunque esa es una pregunta a la que ya dimos respuesta con el cambio en la "profundidad" de los mapas del juego, es posible que no lo recuerdes, así que esta puede ser una buena pregunta que formularle a Gemini.
Este ejemplo también me resulta interesante porque la respuesta es correcta... pero con un pequeño fallo. Como verás, afirma que la mejor capa (coordenada Y) para encontrar diamantes es la -59, y eso es totalmente correcto, pues a partir de la capa -60 empezaremos a encontrar roca base que dificulta avanzar. Sin embargo, en el segundo párrafo afirma, y cito "se pueden encontrar entre las capas Y=-64 e Y=16, con mayor frecuencia en las capas superiores de este rango". Esto no es correcto, es en las capas inferiores, pero parece que en este caso Gemini se ha saltado el signo – del 64 para entender que, en realidad, es la capa más baja, y no la más alta, del rango en el que podemos encontrar diamantes.
Eso sí, de su respuesta me ha llamado la atención la sugerencia de utilizar mods que sean de ayuda para la búsqueda, así que le he preguntado y, la verdad, como puedes ver me ha sugerido un mod (que no conocía) y que ya he instalado para utilizarlo en mis partidas de pruebas.
¿Qué hago para cenar?
¿Has escuchado hablar de la cocina de aprovechamiento? Pues ahora vamos a hablar de la inteligencia artificial de aprovechamiento, que en algún momento, con la nevera bajo mínimos y sin poder salir a comprar nada, puede llegar a ser inteligencia artificial de supervivencia.
Para explicarlo más claramente. Hoy viernes llegas a casa, agotado del trabajo de la semana, y ya es tarde/estás cansado para salir a comprar. Pero entonces abres la nevera y descubres con preocupación una importante escasez de víveres, sumado a que no sabes qué podrías hacer con las cuatro cosas que te quedan. Pues no te preocupes, ya no hace falta que llames a tu madre, a tu amigo el cocinillas o que te pongas a buscar recetas, solo para descubrir que hasta para los platos más básicos necesitas un master en química. En su lugar, dile a Gemini lo que tienes y deja que te sorprenda con una sugerencia.
¿No te convence la primera sugerencia? Bueno, tienes dos opciones. La primera, como ya hemos visto al hablar de Excel, es repreguntar, pero antes de eso, ¿te has fijado en que justo sobre la respuesta, a la derecha, se muestra el texto "Mostrar versiones"? Gemini, por cada consulta, genera tres respuestas, que puedes revisar al desplegar ese apartado. Dale un ojo antes de pedirle más recetas.
« Especial »