Monitor Más Monitor

Meta se suma a fiebre de las IA artísticas

Make-A-Scene está pensado para que las inteligencias humanas tengan algo más de protagonismo en el resultado final.

Publicación:18-07-2022

TEMA: #Inteligencia Artificial

++--

OpenAI sorprendió con Dall-E 2, una inteligencia artificial capaz de dibujar o generar imágenes realistas a partir de cualquier descripción de texto.

Madrid, España.- OpenAI sorprendió a toda la red en abril con Dall-E 2, una inteligencia artificial capaz de dibujar o generar imágenes realistas a partir de cualquier descripción de texto. Un mes después, Google tenía su respuesta, Imagen, capaz de ofrecer resultados de mayor definición. Ahora llega el turno de Meta, la empresa antes conocida como Facebook. Esta semana ha presentado Make-A-Scene, un motor de generación de imágenes que también se apoya en técnicas de inteligencia artificial para generar fotos y dibujos realistas de 2.048 x 2.048 píxeles de resolución.

A diferencia de Dall-E 2 e Imagen, sin embargo, Make-A-Scene está pensado para que las inteligencias humanas tengan algo más de protagonismo en el resultado final. Aunque puede crear una imagen a partir de una descripción de texto, como sus competidores, también puede usar bocetos dibujados por una persona como guía para la imagen final.

Esto soluciona uno de los mayores problemas de estos generadores de imágenes. Aunque sorprenden por su capacidad de entender lo que quiere el usuario, los elementos de la imagen no siempre están donde uno quiere y los resultados, aunque técnicamente sorprendentes pueden estar muy alejados de lo que el autor del texto tenía originalmente en la cabeza.

"Las indicaciones de texto, como "una imagen de una cebra en bicicleta", generan imágenes con composiciones que pueden ser difíciles de predecir. La cebra puede estar en el lado izquierdo de la imagen o a la derecha, por ejemplo, o puede ser mucho más grande que la bicicleta o mucho más pequeña, o la cebra y la bicicleta pueden estar mirando hacia la cámara o mirando hacia los lados. Como resultado, la imagen puede no ser un reflejo de la voz creativa de una persona", explican los responsables del motor.

Make-A-Scene es un proyecto de investigación interno de Meta, y eso quiere decir que, de momento, no hay una herramienta para poder probarlo libremente. Lo mismo ocurre, hasta cierto punto, con Dall-E 2 e Imagen. Tanto OpenAI como Google han abierto sus motores de creación de imágenes a terceros, pero sólo mediante invitación.

Hay varias razones. Generar estas imágenes es un trabajo computacionalmente muy intenso y que consume muchos recursos, incluso con imágenes de resoluciones muy pequeñas. OpenAI y Google apuntan también a que es necesario estudiar más a fondo las implicaciones éticas de estas herramientas, ya que permiten crear escenas falsas de gran realismo. Un proyecto alternativo, originalmente conocido como Dall-E Mini y que ahora se llama Craiyon si funciona sin restricciones, y permite hacerse una idea de cuál es la experiencia de uso, aunque los resultados tienen peor calidad y baja resolución.

« Especial »

Te podria interesar