Whisk es el último experimento de Google en IA generativa: utiliza imágenes para crear otras imágenes

La conferencia de desarrolladores I/O 2024 se celebró a mediados de mayo para que Google pudiese dar a conocer todas sus novedades en lo que se refiere a inteligencia artificial (IA), software y dispositivos.

La IA fue la protagonista de este año, ya que la compañía de Mountain View presentó el modelo Gemini 1.5 Pro, el agente Project Astra, nuevas herramientas de creación de contenido —como Veo (ésta ha recibido una reciente actualización para generar vídeos en 4K de hasta dos minutos) e Imagen 3—, funciones con inteligencia artificial para buscar información en el buscador y varias novedades de Gemini en Google Workspace. La mayoría de estas innovaciones ya están operativas para los usuarios, pero, con el objetivo de seguir ampliando los servicios con IA, Google lanza Whisk, una nueva herramienta que permite generar imágenes usando otras imágenes como indicaciones.

Tal y como indica la compañía tecnológica en su blog oficial, Whisk no requiere una indicación de texto para crear una imagen. Concretamente, con esta herramienta, los interesados pueden ofrecer imágenes para sugerir lo que les gustaría que fuera el tema, el estilo y la escena de la imagen final generada por inteligencia artificial; no obstante, también pueden ingresar texto en un cuadro de texto para agregar detalles adicionales sobre la imagen que están creando.

Google detalla que "el modelo Gemini escribe automáticamente un título detallado de las imágenes y, luego, introduce esas descripciones en el último modelo de generación de imágenes Imagen 3". Recalcando que "este proceso captura la esencia de un sujeto, no una réplica exacta. De esa manera, pueden mezclar fácilmente sujetos, escenas y estilos de formas novedosas".

Por otro lado, la compañía de Mountain View destaca que, dado que Whisk extrae solo algunas características clave de una imagen, es posible que genere imágenes que difieran de las expectativas porque se trata de "un nuevo tipo de herramienta creativa" que favorece la exploración visual rápida.

Respecto a su disponibilidad, Whisk sólo está disponible en Estados Unidos a través de Google Labs. De momento, se desconoce si esta nueva herramienta con inteligencia artificial llegará a España y al resto de países durante las próximas semanas.

Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.

Zircon - This is a contributing Drupal Theme
Design by WeebPal.