LA APP DALL-E DE OpenAI GENERA FOTOGRAFÍAS A PARTIRDE UNA SIMPLE DESCRIPCIÓN

#SLICEofDATA Tu porción diaria de Data Analytics en solo 15 minutos

Jun 10, 2022

OpenAI, una organización cofundada por Elon Musk y patrocinada por Microsoft , que ya aprendió a escribir fake news con Dota 2. Ha alcanzado nuevos logros con DALLE \ (el acrónimo de "WallE" y "Dali"), una aplicación de inteligencia artificial que puede crear imágenes de casi cualquier descripción. Por ejemplo, si pides "sopa de pollo para perros" o "un ejemplo muy real de la unión de elefante y rata", a menudo son sorprendentemente precisos (y en algunos casos no lo son).

DALL-E puede originar fotos instantáneas basándose totalmente en una sinopsis de sus atributos, como "una silla triangular tímida" o "un grupo de libros está sentado en un café". En este ejemplo, sitúa a varios libros bebiendo sentados en una terraza bastante grado de exactitud.

Si existe en tu mente, lo puede dibujar: lo nuevo de OpenAI crea imágenes a partir de palabras

También puede dibujar e integrar varios objetos y mostrar vistas de fantasía únicos, incluso con cortes y vistas del interior de los objetos. A diferencia de otros programas text-to-image, incluso indica detalles que no se mencionan en la descripción. Por ejemplo, con la descripción "un dibujo de un perro sentado en el campo de noche", el resultado es capaz de mostrar incluso la sombra adecuada.

"A diferencia de un motor de renderizado 3D, que los inputs tienen que ser descritos en detalle, DALL-E es capaz de "rellenar los espacios en blanco", cuando el título sugiere que la imagen tiene que contener detalles implícitos.

OpenAI también usa una característica llamada " zero-shot reasoning ". Esto permitió al agente generar una respuesta a partir de explicaciones y sugerencias sin training adicional, que se utilizó para la traducción y otras tareas. Esta vez, los investigadores lo aplicaron al dominio visual para realizar traducciones de imagen a imagen y de texto a imagen. En un ejemplo, pudo crear una imagen de un perro a partir de un boceto, con la nota "Encima está el mismo perro que en el boceto de abajo".

DALL-E: una inteligencia artificial que genera imágenes a partir de texto

El gadget tiene varios talentos diferentes, como el conocimiento de cómo los teléfonos y diferentes aparatos van evolucionando con el tiempo, estadísticas geográficas, puntos de referencia y crear imágenes en estilos fotográficos, ilustrados o incluso de clip-art.

Por ahora, DALL-E es bastante limitado. A veces, te da lo que esperas del título y en otros casos simplemente obtienes algunas instantáneas extrañas o de mala calidad. Al igual que ocurre con otros sistemas de IA, incluso los propios investigadores no entienden exactamente cómo produce ciertas imágenes debido a la naturaleza de caja negra del sistema.

OpenAI's DALL-E AI is becoming a scary-good graphic artist

Aun así, si se sigue evolucionando, DALL-E tiene una gran capacidad para ser disruptivo en campos como las imágenes de stock, con todo lo bueno y terrible que eso conlleva.

"En el futuro, planeamos investigar cómo los modelos tipo DALL-E se relacionan con problemas sociales como el efecto económico en las estrategias profesionales, la capacidad de sesgo dentro de las soluciones del modelo, y los problemas morales exigentes a largo plazo implicadas en esta tecnología".

Ref: DALL·E: Creating Images from Text (openai.com)

OpenAI's DALL-E 2 produces fantastical images of most anything you can imagine | Engadget