Exploration de la Génération Vidéo par IA avec Google Gemini

Google a récemment lancé une fonctionnalité passionnante : la génération de vidéos via son IA, Gemini. Dans cet article, nous allons examiner cinq exemples créés à l’aide de cette technologie innovante, et analyser le potentiel et les limites de cet outil.

Exemples de vidéos générées avec Gemini — Vue d’ensemble des vidéos générées grâce à Gemini. Source : Frandroid

La compétition dans le domaine de l’intelligence artificielle prend une nouvelle tournure. En effet, Google a récemment introduit la possibilité de créer des vidéos via Gemini.

Le concept est simple : l’utilisateur rédige un prompt décrivant la vidéo qu’il souhaite voir, et l’IA génère une vidéo qui correspond (ou de près) à cette demande.

Interface de génération vidéo de Google Gemini — Exemple de prompt dans Gemini pour la génération vidéo. Source : Frandroid

Cette innovation repose sur le modèle de langage Veo 2, qui est disponible depuis quelques mois dans le cadre de l’abonnement Gemini Advanced.

À lire aussi :

Tout savoir sur Google Veo, le nouveau générateur de vidéos boosté par IA

Exemples de Vidéos Générées avec Gemini

Veo 2 représente la réponse de Google à l’application Sora développée par OpenAI. Il s’agit d’un modèle qui pourrait, selon Google, redéfinir les standards de l’IA en matière de création de vidéos.

Dans Gemini, il est possible de générer des vidéos au format MP4 de 8 secondes, en HD (720p) et en format 16:9. Après un temps d’attente d’environ 50 secondes, les vidéos créées peuvent être téléchargées.

1. Un chat à l’Arc de Triomphe

Voici notre premier prompt :

Génère la vidéo d’un chat orange perché sur l’Arc de Triomphe, avec un zoom arrière qui révèle les Champs-Élysées en arrière-plan.

Vidéo d’un chat sur l’Arc de Triomphe générée par Gemini.

L’IA a montré des limites, ne réalisant pas la transition demandée. Effectivement, la vidéo négligeait la séquence de dézoom lente que nous espérions. Néanmoins, elle a bien démontré le monument parisien.

2. Une femme lisant en terrasse

Pour notre deuxième essai, nous avons simplifié le prompt :

Génère la vidéo d’une femme portant des lunettes, en chemise bleue et pantalon blanc, lisant sur une terrasse de café en été.

Vidéo d’une femme lisant en terrasse générée par Gemini.

Le réalisme était présent, même si des animations de lecture peu convaincantes trahissaient des défauts de rendu, notamment en ce qui concerne les mains.

3. Une annonce fictive d’un iPhone pliant

Pour notre troisième vidéo, nous avons demandé quelque chose d’imaginaire :

Génère la vidéo d’une publicité d’un iPhone pliant, à la manière des annonces classiques d’Apple.

Publicité fictive d’un iPhone pliant générée par Gemini.

Bien que l’effort sur le mouvement de caméra ait été apprécié, le design présenté ne correspondrait en rien à ce que l’on attend d’Apple pour un produit pliante.

4. Un personnage d’anime japonais

Pour notre quatrième vidéo, nous avons pris une approche artistique :

Génère la vidéo d’un homme politique s’envolant après un discours, dans un style d’anime japonais.

Vidéo d’un anime japonais générée par Gemini.

Le résultat était amusant et assez fidèle à une animation d’anime classique, même si la structure de notre prompt laissait place à interprétations.

5. Une aventure de randonneurs

Enfin, nous avons essayé un prompt complexe :

Génère la vidéo d’un groupe de randonneurs affrontant une tempête sur une falaise en bord de mer.

Vidéo de randonneurs face à une tempête générée par Gemini.

Bien que certains éléments tels que la météo étaient réussis, les animations des personnages manquaient de réalisme, et l’IA n’a pas pu représenter fidèlement certaines actions demandées.

En somme, bien que Veo 2 offre des résultats intéressants, notamment avec des prompts simples, il est clair que des améliorations sont nécessaires pour les requêtes plus complexes.

Actuellement, il est nécessaire de s’abonner à Gemini Advanced via le forfait Google One AI Premium pour accéder à ces fonctionnalités, ce qui représente un coût de 21,99 euros par mois.

Source : www.frandroid.com

Gemini : Le Nouveau Challenger de ChatGPT ?