Bataille d’IA effrayantes : Midjourney affronte DALL-E 3 dans ChatGPT pour célébrer Halloween !
Long article journalistique en français
Comparaison entre Midjourney et DALL-E 3 : Halloween spécial IA
Ces dernières semaines, nous nous sommes plongés dans l’implémentation de DALL-E 3 dans ChatGPT Plus. En intégrant l’outil de conversion de texte en image dans ChatGPT, l’IA facilite grandement la création d’images. Mais que vaut l’outil face à Midjourney ? Si Midjourney a plus d’outils de personnalisation que l’implémentation de DALL-E dans ChatGPT, il serait intéressant de comparer les résultats des deux IA. A l’occasion d’Halloween, nous avons donc mis en compétition les deux générateurs d’images par IA, en leur soumettant huit requêtes, chacune comprenant un style artistique à respecter lors de la création de l’illustration.
Comment fonctionne le test Midjourney vs. DALL-E 3 dans ChatGPT ?
Les mêmes instructions ont été soumises à chacune des deux IA. La seule différence est dans le début de la requête : chacune était précédée de /imagine dans Midjourney et « image de » pour DALL-E. Midjourney générant automatiquement quatre images, tandis que DALL-E seulement deux, la requête a été lancée deux fois avec DALL-E, pour pouvoir comparer le même nombre d’images.
Les images ont ensuite été regroupées dans Photoshop dans le but d’afficher les huit images candidates côte à côte. Les critères d’évaluation sont les suivants :
- Dans quelle mesure l’IA respecte-t-elle le style proposé ?
- L’IA intègre-t-elle les éléments spécifiques demandés ?
- Quelle est l’image préférée de ma femme (Denise) et quelle est l’IA qui l’a réalisée ?
- Quelle est mon image préférée et quelle est l’IA qui l’a réalisée ?
A la fin du test, les points seront comptés pour désigner le grand gagnant du concours Halloween spécial IA !
Première manche : La gentille sorcière d’Halloween
Voici la requête soumise aux deux IA :
Photoréaliste, 35 mm, une sorcière amicale et joyeuse devant un pavillon de banlieue distribue des friandises à l’occasion d’Halloween.
Voici les résultats – Midjourney à gauche et DALL-E 3 à droite :
La requête aurait pu être plus précise : je voulais que le personnage soit dans l’embrasure de la porte, tourné vers l’extérieur de la maison. Mais, sans précision de ma part, les IA ont proposé des résultats différents. Midjourney n’a pas respecté le cahier des charges, puisqu’aucune image n’affiche vraiment de friandises. Ses sorcières ont toutes un air plutôt étrange. Et que tient exactement la sorcière de l’illustration numéro 4 ? Un téléphone, un rasoir, un tricordeur ? En tout cas, pas une friandise. DALL-E 3 a fait un bien meilleur travail. Ses quatre propositions contiennent des friandises, même si les biscuits de l’illustration numéro 4 ne sont pas très représentatifs du « un bonbon ou un sort » clamé par les enfants lors d’Halloween.
Deuxième manche : Snoopy et la Grande Citrouille
Voici la requête soumise aux deux IA :
Dessin animé des années 1960, la Grande Citrouille d’Halloween avec un chien heureux ressemblant à Snoopy.
Voici les résultats – Midjourney à gauche et DALL-E 3 à droite :
L’interprétation de la requête par DALL-E est plutôt surprenante : on ne voit pas sur l’illustration un chien ressemblant à Snoopy… mais Snoopy lui-même. La première image affiche même Charlie Brown en arrière-plan ! Visiblement, DALL-E ne se pose pas de questions sur le copyright. Ces images sont présentées ici dans le cadre d’un article de presse, avec une démarche journalistique, pour expliquer le travail de l’IA, mais elles ne pourraient pas être utilisées sur un tee-shirt ou quelque production destinée à être commercialisée. En revanche, Midjourney propose des petits chiens blancs, bien qu’aucune de ces citrouilles ne soit assez grande pour être considérée comme la Grande Citrouille (qui est elle-même une marque déposée de Peanuts Worldwide LLC).
Troisième manche : Le chat d’Halloween
Voici la requête soumise aux deux IA :
Hyperréaliste, style Matthias Haker, chat noir d’Halloween heureux, nuit de pleine lune
Matthias Haker est un photographe allemand dont la ville et l’architecture sont les sujets de prédilection. Il joue sur la grandeur des bâtiments et ces photos ont une atmosphère spectrale. Avant d’examiner les résultats des deux IA, parlons un peu de la question de l’utilisation du style d’un artiste par une IA. Les artistes passent leur vie à créer des styles qui leur sont propres, et il est troublant de voir qu’il suffit de les mentionner dans un générateur d’images par IA pour que cette dernière produise un résultat si réaliste. Alors oui, d’un côté, utiliser le nom d’un artiste dans votre requête peut vous faire gagner du temps. Mais d’un autre côté, en faisant cela vous vous appropriez le style de cet artiste. Concernant l’exemple suivant, il est peu probable que Matthias Haker pren
Source : www.zdnet.fr