
Quand l'intelligence artificielle crée des chefs-d'œuvre sur commande

Connaissez-vous DALL·E 2? Si ce n'est pas le cas, c'est normal. Il s'agit d'une technologie toute nouvelle créée cette année. Mais depuis quelques semaines, elle commence à faire le buzz sur les réseaux sociaux. La clé de son succès: cette intelligence artificielle (IA) crée des images réalistes à partir de phrases quelconques, sans intervention humaine. Si on veut résumer, on pourrait dire qu'il s'agit d'illustrer les mots. Un concept tout simple mais la qualité est tellement au rendez-vous qu'on est surpris par ces réalisations qui ont tout de chefs-d'œuvre.
La lecture de votre article continue ci-dessous
Babylone version Dali et astronautes basketteurs avec des chats
Pour vous donner un exemple, prenons la phrase suivante: «Les jardins suspendus de Babylone au milieu d'une ville, dans le style de Dali». Elle n'a aucun sens mais sur base des différents éléments qui la compose, l'IA va créer une image complètement nouvelle. Elle va rechercher les photos représentant les jardins de Babylone, celles d'une ville et elle s'inspire des réalisations de Dali. En mélangeant le tout, cela donne un tableau digne du peintre catalan, alors qu'il ne l'a évidemment jamais créée. Idem si vous voulez une toile représentant un renard dans le style de La Nuit étoilée de Van Gogh ou de Claude Monet.
Voir cette publication sur Instagram
Le concept est déclinable à l'infini. Vous pouvez ainsi demander à DALL·E 2 de vous créer une représentation d'astronautes jouant au basketball avec des chats dans un style de livre pour enfants, ou minimaliste, ou encore sous la forme d'une aquarelle. L'IA peut aussi prendre une image déjà existante, comme celle de la célèbre Jeune Fille à la perle de Vermeer, et en créer de multiples variations. À chaque fois, le résultat est plus que convaincant. Plus besoin de se casser la tête à créer de belles couvertures de bouquins ou des affiches tape-à-l'œil. La machine le fait pour vous (sans se soucier des emplois d'artistes qui sont en jeu, mais ça c'est un autre débat).
Voir cette publication sur Instagram
Éviter les dérives pour maximiser l'intérêt du programme
Pour arriver à ce résultat, l'entreprise OpenAI a d'abord mis au point DALL·E en janvier 2021. Déjà à ce moment-là, l'IA était capable de créer ce type de résultat à partir de mots. Une technique surnommée «difussion». Un an plus tard, DALL·E 2 pousse la barre un peu plus loin avec une résolution multipliée par quatre, ce qui donne des images beaucoup plus convaincantes. Le réalisme passe clairement à un niveau supérieur et la correspondance avec les légendes est bien plus pointue.
Si vous vous inquiétez de voir l'IA créer des images violentes du fait de personnes mal intentionnées, OpenAI assure pouvoir vous convaincre. La société a en effet créé un algorithme pour supprimer ce type de contenu, du moins de façon explicite. L'image qui découlerait de ce genre de phrase serait ainsi très métaphorique. DALL·E 2 évite aussi d'utiliser des visages réels d'individus, notamment de célébrités, pour ne pas créer le même type de dérives que le deepfake.
Voir cette publication sur Instagram
«Notre espoir est que DALL·E 2 permettra aux gens de s'exprimer de manière créative. DALL·E 2 nous aide également à comprendre comment les systèmes d'IA avancés voient et comprennent notre monde, ce qui est essentiel à notre mission de créer une IA qui profite à l'humanité», explique OpenAI.
Le «langage secret» de DALL·E 2
Évidemment, DALL·E 2 n'est pas parfait. Il identifie parfois mal les concepts présents dans une phrase, surtout s'il s'agit de néologismes. C'est ce dont rend compte The Independant qui relaie l'histoire d'un doctorant en informatique à Austin, Giannis Daras. Ce dernier a demandé au programme de créer une photo de paysans parlant à des légumes tout en y introduisant le mot «vicootes» (qui n'existe pas). Résultat: l'image montrait des plats avec des légumes. C'est en s'intéressant de plus près à ce phénomène que l'université du Texas a découvert que DALL·E 2 créait son propre vocabulaire (qui est aussi absurde que certaines phrases qui lui sont soumises). Dans son langage, «Apoploe vesrreaitais» veut par exemple dire «oiseau». «La découverte du langage Dalle-2 crée de nombreux défis intéressants en matière de sécurité et d'interprétabilité», s'émerveillent les informaticiens texans suite à l'étude qu'ils ont publiée. Leur conclusion doit encore faire l'objet de recherches complémentaires pour confirmer ou pas que l'IA a créé une langue toute seule, comme une grande!
DALLE-2 has a secret language.
"Apoploe vesrreaitais" means birds.
"Contarra ccetnxniams luryca tanniounons" means bugs or pests.The prompt: "Apoploe vesrreaitais eating Contarra ccetnxniams luryca tanniounons" gives images of birds eating bugs.
A thread (1/n)🧵 pic.twitter.com/VzWfsCFnZo
— Giannis Daras (@giannis_daras) May 31, 2022
Si vous voulez tester vous-mêmes, OpenIA vous permet de rejoindre une liste d'attente pour soumettre une phrase. Le résultat pourra ensuite être mis en ligne sur les réseaux sociaux. Plusieurs internautes ont déjà tenté le coup avec des phrases plus farfelues les unes que les autres («Steve Jobs en jouet Happy Meal», «Dark Vador mangeant des frites», etc.) avant de partager les images sur leurs comptes Twitter ou Instagram.
darth vader eating french fries, realism, sharp, bright, digital art #dalle2 #dalle #openai pic.twitter.com/cBJYfxlkax
— Dalle2 Pics (@Dalle2Pics) June 2, 2022
Steve Jobs as a Happy Meal toy #dalle2 pic.twitter.com/LPFqo1NU9C
— All Technique No Passion (@ATNPassion) June 7, 2022