Gemini : Le Nouveau Challenger de ChatGPT ?

Exploration de la Génération Vidéo par IA avec Google Gemini
Google a récemment lancé une fonctionnalité passionnante : la génération de vidéos via son IA, Gemini. Dans cet article, nous allons examiner cinq exemples créés à l’aide de cette technologie innovante, et analyser le potentiel et les limites de cet outil.

La compétition dans le domaine de l’intelligence artificielle prend une nouvelle tournure. En effet, Google a récemment introduit la possibilité de créer des vidéos via Gemini.
Le concept est simple : l’utilisateur rédige un prompt décrivant la vidéo qu’il souhaite voir, et l’IA génère une vidéo qui correspond (ou de près) à cette demande.

Cette innovation repose sur le modèle de langage Veo 2, qui est disponible depuis quelques mois dans le cadre de l’abonnement Gemini Advanced.
Exemples de Vidéos Générées avec Gemini
Veo 2 représente la réponse de Google à l’application Sora développée par OpenAI. Il s’agit d’un modèle qui pourrait, selon Google, redéfinir les standards de l’IA en matière de création de vidéos.
Dans Gemini, il est possible de générer des vidéos au format MP4 de 8 secondes, en HD (720p) et en format 16:9. Après un temps d’attente d’environ 50 secondes, les vidéos créées peuvent être téléchargées.
1. Un chat à l’Arc de Triomphe
Voici notre premier prompt :
Génère la vidéo d’un chat orange perché sur l’Arc de Triomphe, avec un zoom arrière qui révèle les Champs-Élysées en arrière-plan.
L’IA a montré des limites, ne réalisant pas la transition demandée. Effectivement, la vidéo négligeait la séquence de dézoom lente que nous espérions. Néanmoins, elle a bien démontré le monument parisien.
2. Une femme lisant en terrasse
Pour notre deuxième essai, nous avons simplifié le prompt :
Génère la vidéo d’une femme portant des lunettes, en chemise bleue et pantalon blanc, lisant sur une terrasse de café en été.
Le réalisme était présent, même si des animations de lecture peu convaincantes trahissaient des défauts de rendu, notamment en ce qui concerne les mains.
3. Une annonce fictive d’un iPhone pliant
Pour notre troisième vidéo, nous avons demandé quelque chose d’imaginaire :
Génère la vidéo d’une publicité d’un iPhone pliant, à la manière des annonces classiques d’Apple.
Bien que l’effort sur le mouvement de caméra ait été apprécié, le design présenté ne correspondrait en rien à ce que l’on attend d’Apple pour un produit pliante.
4. Un personnage d’anime japonais
Pour notre quatrième vidéo, nous avons pris une approche artistique :
Génère la vidéo d’un homme politique s’envolant après un discours, dans un style d’anime japonais.
Le résultat était amusant et assez fidèle à une animation d’anime classique, même si la structure de notre prompt laissait place à interprétations.
5. Une aventure de randonneurs
Enfin, nous avons essayé un prompt complexe :
Génère la vidéo d’un groupe de randonneurs affrontant une tempête sur une falaise en bord de mer.
Bien que certains éléments tels que la météo étaient réussis, les animations des personnages manquaient de réalisme, et l’IA n’a pas pu représenter fidèlement certaines actions demandées.
En somme, bien que Veo 2 offre des résultats intéressants, notamment avec des prompts simples, il est clair que des améliorations sont nécessaires pour les requêtes plus complexes.
Actuellement, il est nécessaire de s’abonner à Gemini Advanced via le forfait Google One AI Premium pour accéder à ces fonctionnalités, ce qui représente un coût de 21,99 euros par mois.
Source : www.frandroid.com