Las imágenes IA o imágenes generadas por IA, han revolucionado la industria el último año haciendo su aporte a la avalancha de inteligencia artificial generativa que se ha tomado todas las conversaciones.
La creación de imágenes computacionales no es nueva, al menos desde Google Deep Dream en 2015, la industria ha estado trabajando en esta área de la IA.
La diferencia es que hoy las herramientas necesarias para crearlas han mejorado excepcionalmente y están disponibles para casi todos los usuarios.
En esta nota hacemos una panorámica de las tecnologías que están protagonizando esta revolución y junto a Cristian Rozas, José Estévez y Javier Villagrán, analizamos su impacto.
Creación de imágenes computacionales
La fotografía computacional mezcla los elementos de la fotografía tradicional con el procesamiento adicional realizado por computadora. Y de alguna manera, está empujando los límites de lo que significa la fotografía.
La razón por la que los generadores de imágenes de IA se han vuelto populares el último año es clara. Antes eran malos. La tecnología que los hacía posibles era impresionante para sus investigadores, pero las imágenes generadas eran defincientes.
Incluso el DALL.E original fue más una novedad que una revelación, cuando se lanzó en 2021.
Pero en los últimos 12 meses se ha estado escribiendo, o generando mejor dicho, una revolución.
Las principales tecnologías para generar imágenes por IA
Son varias y cada día aparecen nuevas, pero según sitios especializados, estas son las más poderosas: Dall.E2, Midjourney y Stable Diffusion.
Dall.E2
DALL.E2 es el nombre más importante en generadores de imágenes de IA, y por una buena razón. Fue el primer generador de imágenes impulsado por IA capaz de crear imágenes de calidad que se volvió viral.
Para utilizarlo debes registrarte en OpenAI, adquirir créditos, escribir en un prompt lo que deseas ver y pulsar el botón generar. En unos segundos, tendrás cuatro variaciones de imágenes generadas por IA para elegir.
Hasta abril de este año te registrabas y obtenías 50 créditos gratis y otros 15 gratis cada mes. Ahora debes comprar, desde los 115 créditos a 15 dólares.
Midjourney
Midjourney es conocido porque sus imágenes son más ricas, con mejores texturas y colores. Además, fue el primer generador de imágenes de IA en ganar un concurso de arte.
A esta inteligencia artificial solo puedes acceder a través de Discord. Una vez que te unes al servidor de Discord de Midjourney, puedes comenzar tu viaje siguiendo este paso a paso de Midjourney, que básicamente se resume así:
Haces el prompt, el bot generará cuatro variaciones de tu orden, puedes descargar, mejorar, volver a editar y más.El plan básico de Midjourney comienza en $10/mes y viene con 3,3 horas de tiempo o alrededor de 200 imágenes.
Stable Diffusion
A diferencia de DALL·E2 y Midjourney, Stable Diffusion es de código abierto. Esto significa que cualquier persona con las habilidades técnicas requeridas puede descargarlo y ejecutarlo localmente en su propia computadora.
Pero Stable Diffusion también está disponible en una aplicación pública llamada DreamStudio, creada por sus desarrolladores, Stability AI.
DreamStudio funciona con un sistema de crédito. Cuando te registras, obtienes 100 créditos gratis, que son válidos para 500 imágenes con la configuración predeterminada.
Usar un modelo más potente, generar imágenes más grandes o repetirlas a través de más pasos consumirá sus créditos más rápido. Una vez que haya terminado, deberá comprar más, a partir de 10 dólares por 1.000 créditos.
Uso de generación de imágenes de IA en redes sociales
¿Estás interesado en la IA, pero no estás muy seguro de cómo usarla en el trabajo? Estas son algunas de las formas en que las personas recurren a la generación de imágenes de IA en sus funciones:
-Generación de imágenes destacadas para publicaciones de blog
-Creación de publicaciones en redes sociales
-Generación de presentaciones de diapositivas y guiones gráficos
-Creación de imágenes personalizadas para los clientes
El debate, los límites y los desafíos de la IA en imágenes
Las tecnologías que generan imágenes con inteligencia artificial pueden ser una amenaza para profesionales de la imagen como fotógrafos, ilustradores o diseñadores.
“Midjourney genera imágenes hiperrealistas que no puedes diferenciar bien si han sido hechas por IA o por humanos”, dice Cristian Rozas, gerente general de Fusiona.
“La clave es ver las manos, a veces lo hace bien y a veces lo hace mal”, comenta Javier Villagrán, director de estrategia de Fusiona.
“Da miedo lo que genera. Estas tecnologías parecen mágicas”, comenta José Estévez, líder técnico de Fusiona, recordando una sensación parecida a la que provocó la salida de Chat GPT.
Más allá del mérito artístico, para Rozas es relevante el impacto de esta tecnología en términos de industria y negocio.
“Qué pasará con los derechos de autor de los bancos de imágenes. Firefly de Adobe ya está vendiendo imágenes generadas por IA. Puede ser completamente tuya por 50 dólares. ¡50 dólares por algo que les tomó 30 segundos de procesamiento!”, dice Cristian.
“Las compañías que encuentren la forma de generar los insumos que necesitan para satisfacer las necesidades de sus clientes lo harán. Es más económico y rápido. El tremendo trabajo de producir, montar y tomar una fotografía, en Midjourney te puede tomar 10 minutos, los derechos de autor son tuyos y la puedes usar donde quieras y por 10 dólares al mes”, continúa Rozas.
“Estas tecnologías van a cambiar la naturaleza del trabajo, no van a desaparecer los fotógrafos, ilustradores o diseñadores…vamos a tener ilustradores jefe con un asistente ultra poderoso al lado (la IA). No necesitarás 50 personas, sino tres líderes con sus asistentes al lado”, vislumbra Javier.
“Todo está mutando muy rápido, se están inventando nuevos cargos, otros están dejando de existir”, dice José.
Listos para la foto
La generación de imágenes de IA es un espacio en rápida evolución que el último año se ha acelerado. El video de Adobe Firefly publicado hace dos meses dejó con la boca abierta a medio mundo, Google aún no ha hecho que Imagen esté disponible públicamente, pero promete…Mientras, Meta no ha publicado nada basado en sus algoritmos Make-A-Scene para el público, pero sin duda tendrá algo que decir.
Los invitamos a estar atentos a este tema, conociendo la foto del momento y pendientes de las imágenes que el futuro nos traerá.