octubre 12, 2022 Otto Saura

DALL-E 2: la Transformación Digital de las Artes Gráficas

TRANSFORMACIÓN DIGITAL

La Transformación Digital llega a las artes gráficas mediante determinados programas de inteligencia artificial. Estos programas sin duda van a revolucionar la ilustración, la fotografía y la edición de imagen. Hoy hablamos de DALL-E 2, el software de generación de imágenes de OpenAI y sin duda una de las tecnologías de las que más se habla últimamente.

Existen otros programas similares, como Stable Diffusion o NeuroGen. Muchos de ellos están en desarrollo o, como en el caso de DALL-E 2, en forma de versiones de prueba. Pero todos ellos se centran en una tarea realmente impresionante: podemos pedir una imagen de algo en concreto a ese programa y la genera. No busca la imagen en una base de datos o en internet, sino que el programa, mediante su inteligencia artificial, crea una imagen totalmente nueva y libre de copyright basándose en lo que le hemos pedido.

Podemos pedirle cualquier cosa, ya sea “una imagen realista de un astronauta montando a caballo”, “un óleo de un gato con alas bajo el agua” o “un unicornio amarillo al estilo de Claude Monet”. Y este programa informático genera varias versiones de lo que le hemos pedido en tan solo veinte segundos, algo que implicaría muchas horas para un ilustrador.

En este artículo vamos a destacar algunos detalles del funcionamiento de DALL-E 2, así como algunas limitaciones y fallos que tiene. ¡Al lío!

¿Qué es DALL-E 2?

El nombre de este programa se parece a WALL-E, el famoso robot de Pixar, pero suena como Dalí para hacer referencia al famoso pintor surrealista Salvador Dalí. Con esta mezcla, OpenAI está insinuando que estamos ante un artista robótico y esto es bastante cierto, pues estamos ante un software con inteligencia artificial capaz de crear obras “artísticas”, si es que admitimos como “arte” las imágenes generadas por un programa informático.

Más allá de la terminología que empleemos, sin duda DALL-E 2 va a revolucionar las artes gráficas: muchos editores de imagen e ilustradores temen ser sustituidos por este tipo de software en un futuro próximo. Aunque, echando la vista atrás, cada vez que aparece una nueva tecnología surgen discursos fatalistas que se oponen a su implantación, como ocurrió con los luditas. Pero estas tecnologías siempre acaban siendo herramientas útiles que a su vez generan nuevos tipos de trabajos: se está hablando ya de la necesidad de expertos en saber qué pedir a estos softwares para que den los resultados esperados.

¿Cómo funciona DALL-E 2?

En cuanto a su funcionamiento, la clave de estos softwares es la tecnología conocida como Generative Pre-Training Transformer (GPT). Esta tecnología fue desarrollada por OpenAI en 2018 y al año siguiente desarrollaron una segunda versión: GPT-2. Finalmente, en 2020 se desarrolló GPT-3, utilizada en la primera versión de DALL-E.

Por otro lado, DALL-E apareció junto a CLIP. CLIP es un software de reconocimiento de imágenes que se encarga de evaluar y clasificar los resultados de DALL-E. CLIP actúa como una especie de filtro para que los resultados de DALL-E sean óptimos.

La primera versión de DALL-E salió en 2021 y DALL-E 2 ha aparecido en 2022. La herramienta ha mejorado notablemente en tan solo un año, pero esto se debe a que la tecnología de generación de imágenes es muy diferente. DALL-E 2, al igual que otro generador de OpenAI llamado GLIDE, emplea modelos de difusión: modelos generativos increíblemente potentes.

¿Qué podemos hacer con DALL-E 2?

Como hemos comentado en la introducción de este artículo, DALL-E 2 puede crear imágenes a partir de las indicaciones que le demos. Imagina poder escribir “jirafa en patinete” y que el programa te de una imagen de eso mismo. Ahora quiero una “jirafa en patinete en París por la noche”, pues ahí la tienes. Pero no, ahora quiero una “jirafa en patinete en París por la noche pintada por Gustav Klimt”, bien, pues eso es lo que DALL-E 2 te da.

DALL-E 2 puede también colocar elementos nuevos en una imagen ya existente. Podemos pedirle que coloque un sofá en una foto de nuestro comedor para ver cómo quedaría o que añada un centauro en un cuadro de Vincent van Gogh. En todo momento el objeto añadido tendrá una concordancia estilística con la imagen, es decir, será realista si lo ponemos en una foto o estará pintado con un estilo particular si lo colocamos en un dibujo o un cuadro.

Podemos también indicar a DALL-E 2 qué parte de la imagen queremos que modifique. Por ejemplo, coger una foto familiar y pedir que coloque un gato siamés sentado en el sofá que aparece a la derecha o pedirle que lo coloque en el suelo o donde queramos.

¿Qué limitaciones tiene DALL-E 2?

Aunque el funcionamiento de este software parece cosa de magia, lo cierto es que comete fallos en algunas ocasiones. Quizá algún elemento no está bien situado o no tiene una proporción adecuada, o quizá alguna cara resulta extraña o un objeto aparece deformado. A veces ni siquiera añade todos los elementos que le hemos pedido.

El programa tiene también limitaciones que han sido programadas voluntariamente por OpenAI. Por ejemplo, DALL-E 2 no puede generar imágenes violentas, pornográficas, discriminatorias o que incluyan la cara de una persona famosa. 

DALL-E 2 tiene también una limitación a causa de haberse entrenado con imágenes extraídas de internet: ofrece resultados estereotípicos. Por ejemplo, siempre que se le pide “profesional de la construcción” ofrece imágenes de hombres blancos y siempre que se le pide “auxiliar de vuelo” muestra mujeres asiáticas. Esto nos dice mucho acerca de los estereotipos presentes en las imágenes de internet, pues DALL-E se ha entrenado viendo estas imágenes.

Te ayudamos con la Transformación Digital de tu negocio

A pesar de los fallos que pueda tener, este software está dejando boquiabiertos a aquellas personas que lo están probando. Y la Transformación Digital sigue avanzando, quién sabe qué avances aparecerán en los próximos años. 

Quizá la inteligencia artificial diseñará estrategias de Marketing Online. Parece cercano el día en que las imágenes generadas por inteligencia artificial se empleen en el Inbound Marketing. De momento, desde Ok Otto Agency podemos ayudarte con todas estas cuestiones. Contacta con nosotros, estaremos encantados de ser tu agencia de Transformación Digital en Barcelona.

Comparte

¿Te gustaría saber más sobre la Transformación Digital?

    ¿Necesitas Ayuda con tu Estrategia de Transformación Digital?

    Contacta y un consultor resolverá tus dudas

    Últimas Noticias de Transformación Digital

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *