Segunda ronda de IA
En mi primer artículo Pensé en la fascinación y los peligros de las imágenes generadas por IA. Ahora he comenzado un pequeño experimento para crear mejores imágenes de IA utilizando IA. Al principio suena un poco extraño. Va bien:
Para generar una imagen mediante IA, es necesario formular una descripción de la imagen, la llamada "Inmediato". En Midjourney, la plataforma en la que ingreso mis indicaciones, formulé el siguiente texto (el inglés produce mejores resultados):
Fotografía de autobuses antiguos en una estación de autobuses con una mujer sentada en uno de los autobuses mirando por la ventana con gotas de agua en la ventanilla. La mujer tiene cabello negro y un rostro con expresión triste, zona industrial, noche, colores fríos excepto dentro del autobús con la mujer, la fotografía debe lucir como un cuadro de Edward Hopper pero ultrarrealista. La fotografía está tomada desde fuera del autobús. En la imagen se puede ver el autobús completo y otros autobuses al fondo. Disparo con dron en dji mavic 3.
Midjourney generó cuatro imágenes a partir de este texto:
Resultados visualmente atractivos, pero no corresponden a mi intención. Así que pedí ayuda a la IA y le pedí a Copilot de Microsoft (muchas gracias a Jannik por la introducción) que formulara una versión más detallada de diez oraciones de mi texto. Salió el siguiente texto:
La fotografía es una visión general de una antigua estación de autobuses tomada desde el exterior del autobús. La estación está ubicada en una zona industrial y la fotografía fue tomada de noche. La fotografía tiene una paleta de colores fría a excepción del interior del autobús donde está sentada la mujer. La mujer tiene cabello negro y una expresión triste en su rostro. Está sentada en uno de los autobuses y mirando por la ventana. La ventana tiene gotas de agua, lo que aumenta el ambiente melancólico de la fotografía. La fotografía está tomada desde un dron usando un DJI Mavic 3. La fotografía es ultrarrealista y parece un cuadro de Edward Hopper. La fotografía captura el autobús completo y otros autobuses al fondo. La fotografía es un ejemplo sorprendente de cómo una fotografía puede capturar el estado de ánimo de un lugar y las emociones de una persona.
Con esta descripción, Midjourney generó imágenes nuevas y diferentes:
Lo intenté de nuevo:
La fotografía es una visión general de una antigua estación de autobuses tomada desde una perspectiva aérea. Hay cinco autobuses en la estación de autobuses que está ubicada en una zona industrial y la fotografía fue tomada en una noche lluviosa. Todos los autobuses están vacíos, excepto uno en el que hay una señora sentada dentro. La fotografía tiene una paleta de colores fríos excepto en el interior del autobús donde la mujer está sentada mirando por la ventana. La ventana tiene gotas de agua, lo que aumenta el ambiente melancólico de la fotografía. En este autobús, una luz cálida ilumina el interior del autobús. La mujer tiene cabello negro y una expresión triste en su rostro. La fotografía está tomada desde un dron usando un DJI Mavic 3. La fotografía es ultrarrealista y tiene un estilo como un cuadro de Edward Hopper.
Ahora la estación de autobuses quedó mejor, pero la escena se mostró desde tan lejos que ya no se ve a la persona individual:
Desistí de la idea de tomar una fotografía aérea y formulé un nuevo texto junto con mi copiloto:
La fotografía es una imagen ultrafotorrealista capturada con una cámara Leica M y una lente de 21 mm. La fotografía es un potente plano gran angular que capta toda la estación de autobuses. En primer plano se puede ver un autobús iluminado desde el interior. Una mujer joven de cabello negro está sentada en una ventana en medio del autobús, mirando tristemente por la ventana. La fotografía fue tomada durante la hora azul, lo que le da una paleta de colores fría. Sin embargo, el interior del autobús donde está sentada la mujer está bañado por una luz cálida, creando un marcado contraste con los colores fríos del exterior. Al fondo se pueden ver otros autobuses estacionados en la estación de autobuses. Todos están vacíos y en la imagen completa no se ve a ninguna otra persona excepto a la mujer sentada en el autobús iluminado. Está lloviendo y se ven gotas de agua en las ventanillas de los autobuses.
Aquí está el nuevo resultado:
Todavía no es lo que imaginaba en mi mente, pero es mejor. Me gustó más la imagen en la parte inferior derecha, e hice que Midjourney generara cuatro versiones de esta foto:
Realmente no logré implementar lo que tenía en mi mente. La siguiente imagen captura al menos en parte el estado de ánimo que tenía en mente:
Apéndice
Midjourney acaba de actualizarse y la versión 6.0 ya está en línea. Con esta versión logré por primera vez generar una imagen mucho más cercana a mi descripción de texto. Sobre todo, el sistema ha registrado ahora correctamente que la imagen fue tomada desde el exterior del autobús. La tecnología avanza rápidamente y en tan solo unos meses veremos resultados aún más precisos.