Révolution visuelle : ChatGPT s’équipe d’une IA d’images pour surpasser MidJourney !

OpenAI dévoile sa toute nouvelle IA de génération d’images intégrée à ChatGPT

Pour tous ceux en quête d’une intelligence artificielle capable de générer des images de qualité, et ce, sans débourser un centime, la bonne nouvelle est là ! OpenAI a révélé une fonctionnalité fascinante, intégrée directement à ChatGPT !

Auparavant, OpenAI offrait DALL-E pour la création d’images, mais la performance laissait à désirer. Le modèle DALL·E 3, lancé en 2023, n’arrivait pas à se mesurer à des concurrents tels qu’Aurora, Imagen 3 ou Midjourney.

YouTube video
Découvrez la nouvelle fonctionnalité d’OpenAI en vidéo !

Cependant, OpenAI n’avait pas l’intention de rester en arrière. Le 25 mars 2023, cela a été confirmé.

Sam Altman, le PDG d’OpenAI, a annoncé : « Nous introduisons l’une des fonctionnalités les plus innovantes que nous ayons jamais conçues : la création d’images natives dans ChatGPT. »

Cette avancée répond à une demande croissante, surtout avec la concurrence de Google Gemini, qui propose déjà une fonction similaire depuis mi-2024.

Présentation de 4o Image Generation par OpenAI

Le nouveau modèle de génération d’images se nomme « 4o Image Generation ». Il s’agit plus d’une extension de GPT-4o que d’un simple « DALL·E 4 ».

Ce modèle s’appuie sur les capacités multimodales de GPT-4o, fruit d’un entraînement sur un vaste corpus d’images, ce qui lui permet d’optimiser sa compréhension des requêtes formulées en langage naturel.

Une vaste corpus d'images futuriste
Illustration des vastes corpus d’images utilisés pour l’entraînement de l’IA.

OpenAI a mis un point d’honneur à rendre la génération de texte dans les images beaucoup plus performante. Ainsi, ChatGPT est capable de produire des affiches, des logos ou des panneaux avec du texte parfaitement intégré et compréhensible.

Fini les prompts compliqués : une simple description de votre idée suffit pour que l’IA génère une image correspondante.

De plus, ce modèle a la capacité de gérer jusqu’à 20 requêtes simultanément, une amélioration significative par rapport à DALL-E qui se limitait à trois ou quatre instructions à la fois.

En résumé, 4o Image Generation est désormais accessible aux abonnés de ChatGPT Plus, Pro et Team, mais également aux utilisateurs gratuits. Les versions Entreprise et Éducation y auront prochainement accès. Ce modèle deviendra la référence pour toutes les créations visuelles, mais les utilisateurs nostalgiques de DALL·E pourront toujours y accéder via une option dédiée.

ChatGPT confronte Photoshop

YouTube video
ChatGPT promet une concurrence de taille avec les outils de design classiques.

Avec cette mise à jour, ChatGPT ne se limite pas à créer des images, mais introduit également des outils d’édition avancés. À l’instar de Google Gemini et Imagen, le célèbre chatbot d’OpenAI permet désormais de modifier des visuels.

Les utilisateurs peuvent envoyer une image et demander des retouches spécifiques, comme changer l’arrière-plan ou intégrer de nouveaux objets. L’IA peut même retenir jusqu’à 15 images afin d’affiner les retouches au fil des modifications.

Cependant, la question des images d’êtres humains reste délicate. Bien qu’OpenAI affirme que son modèle peut générer des visages réalistes, il impose des restrictions concernant les personnalités publiques.

Contrairement à des modèles comme Grok, qui produisent presque tout sans filtre, ChatGPT continuera d’opérer dans un cadre plus sécurisé, bien que les limites exactes demeurent floues.

Ce qui joue en faveur d’OpenAI, c’est que 4o Image Generation est intégré directement à ChatGPT, une plateforme déjà utilisée par 400 millions de personnes chaque semaine. Une stratégie bien pensée !

Il convient de noter qu’OpenAI prévoit de rendre cette nouvelle fonctionnalité accessible à d’autres développeurs via une API, et son générateur de vidéos, Sora, bénéficiera également de ces mises à jour à l’avenir.

Quelle est votre opinion sur cette initiative d’OpenAI ? Avez-vous déjà eu l’occasion de l’essayer ?

Partagez vos réflexions dans les commentaires ci-dessous !

Visual revolution

Notre blog est alimenté par les lecteurs. Lorsque vous achetez via des liens sur notre site, nous pouvons percevoir une commission d’affiliation.

Source : www.lebigdata.fr

➡️ Accéder à CHAT GPT4 en cliquant dessus

Veuillez vous connecter pour commenter.