Este último mes no paramos de oír hablar de algo llamado DALL·E. Unos hablan de imágenes, otros de textos, otros de inteligencia artificial… Y es que es nada menos que una combinación de estas tres cosas.
DALL·E es un nuevo sistema de inteligencia artificial lanzado por OpenAI, propiedad de Elon Musk, en enero de 2021. Es capaz de crear desde cero imágenes relativamente realistas y, sobre todo, arte, únicamente con una descripción en un lenguaje natural. Es capaz de combinar diferentes conceptos, atributos y estilos para conformar una imagen coherente con lo que escribes.
Esta IA es capaz de entenderte en cualquier idioma, así que (al menos en teoría, ojo) no tienes necesariamente que escribir algo en inglés. Algunos hemos probado su versión web, DALL·E mini, y estos han sido algunos de los resultados:
DALL·E 2
Actualmente, ya están desarrollando la segunda versión de este software inteligente, que, además de hacer todo lo mencionado anteriormente, tiene otras características nuevas. DALL·E 2 es capaz de hacer ediciones muy realistas sobre imágenes existentes solo con la descripción que le facilites. Ha sido presentado en enero de 2022, pero todavía continúa en fase de desarrollo.
En estas ediciones, puede añadir y eliminar distintos elementos, sin que afecte a la composición, las sombras, colores, o incluso reflejos de la imagen que toma como base. De la misma manera, también puede crear distintas variaciones o reinterpretaciones de una misma imagen.
DALL·E 2 ha aprendido a relacionar mucho mejor las imágenes y el texto. Para ello, usa un proceso llamado “difusión”. Comienza con un patrón de puntos aleatorios y, gradualmente, lo va alterando cuando reconoce ciertos aspectos específicos de la imagen.
Con esta nueva evolución, esta IA no solo es capaz de generar imágenes más realistas y coherentes con la descripción que se le proporciona, sino que lo hace con el cuádruple de resolución.
Por el momento, el acceso a DALL·E 2 solo se encuentra en manos de algunos privilegiados, pero podemos realizar una petición para probarlo a través del formulario web de OpenAI.
Nuevos límites de seguridad
A causa del acceso global a la herramienta anterior, y por consiguiente, su uso indebido, OpenAI ha decidido implementar una serie de limitaciones a DALL·E 2:
- Prevención de generación de contenido peligroso: se ha limitado la habilidad de DALL·E 2 para general imágenes violentas, de incitación al odio, o adultas.
- Frenado del mal uso: el contenido de la política de OpenAI no permite a sus usuarios generar contenido violento, adulto o político.
- Implementación por bases basada en el aprendizaje: DALL·E 2 será probado por usuarios de confianza, que ayudarán a conocer las capacidades y limitaciones de la herramienta.
IMAGEN
Hace unas semanas, Google nos sorprendía con una nueva IA que crea imágenes ultrarrealistas a partir de texto. Se trata de una clara alternativa a DALL·E, que, por desgracia, todavía no se encuentra disponible para los usuarios.
En palabras de la compañía, IMAGEN de momento es una mera investigación. Por motivos éticos, es mejor que de momento solo sea utilizada para ese mismo fin.
Su funcionamiento es similar al de DALL·E 2, pero ha logrado resolver algunas de sus lagunas. Los suertudos que la han probado, de momento, prefieren de hecho sus imágenes antes que las de la herramienta de OpenAI. Basada en el modelo Transformer T5, es capaz de producir imágenes escalables a 1024x1024px.
¿Quieres probar a DALL·E?
Si quieres echar un vistazo a cómo funciona, y probar a esta pequeña y curiosa inteligencia artificial, puedes hacerlo desde cualquier dispositivo con conexión a Internet. Solo tienes que acceder a esta página, que te permite tener acceso a DALL·E mini.
¡Estaremos encantados de ver qué imágenes sois capaces de realizar DALL·E y tú!
¿Para qué puede servir DALL·E?
El objetivo principal de este software inteligente es empoderar a aquella gente quizá más insegura para expresarse de forma creativa. Es una forma increíble de entender cómo los sistemas de inteligencia artificial perciben y entienden nuestro mundo.
En un punto, esto será crucial para que podamos crear inteligencias artificiales no dañinas, que puedan convivir con nosotros.
Estos nuevos sistemas texto-a-imagen serán capaces de ayudarnos a imaginar un sinfín de posibilidades, y supondrán un impulsoen nuestro nivel creativo. También podrían tener una interesante aplicación, por ejemplo, en el metaverso (puedes leer nuestro artículo acerca del metaverso aquí, en nuestro blog).
Comentarios <02>