Google a lancé une nouvelle fonctionnalité sur sa plateforme Gemini, intégrant les capacités de son modèle d’intelligence artificielle pour la création de vidéos, Veo 2. L’entreprise avait précédemment démontré le potentiel de Veo 2 en présentant des vidéos générées qui étaient indiscernables des séquences réelles.
La mise en œuvre actuelle s’adresse spécifiquement aux utilisateurs de Gemini Advanced, qui peuvent créer de courtes vidéos à partir de simples descriptions textuelles, en tirant parti de la puissance du modèle Veo 2 directement dans l’interface de Gemini.
Le service Gemini Advanced permet désormais de produire des clips vidéo de huit secondes en résolution 720p. Pour cela, il suffit de sélectionner Veo 2 dans le menu des modèles disponibles dans l’application Gemini et de fournir une description du contenu vidéo souhaité.
L’entreprise met en avant que Veo 2 permet d’obtenir des résultats très précis, en répondant à des demandes détaillées concernant des éléments spécifiques, le style visuel, le cadrage, et même des simulations de différents types d’objectifs photographiques. Les vidéos générées respectent le format standard 16:9, et les utilisateurs peuvent facilement les télécharger et les partager au format MP4.
Selon Google, Veo 2 améliore la représentation réaliste de la physique et de l’anatomie humaine. Cela se traduit par une production vidéo plus précise, sans les artefacts habituels tels que des doigts en trop ou des mouvements d’objets contraires aux lois physiques.
De plus, Google intègre SynthID, un filigrane numérique invisible, sur chaque image vidéo produite par Veo 2. Cette technologie est utilisée comme un gage de transparence pour identifier le contenu généré par l’IA, bien que la protection contre les erreurs d’interprétation pour le public moins attentif demeure incertaine.
Veo 2 élargit également son champ d’action à Whisk, l’outil de Google dédié à la création d’images par le biais de l’intelligence artificielle. Whisk génère des visualisations en combinant trois éléments : le sujet, la scène et le style. En plus de Gemini, Whisk offre désormais aux abonnés de Google One AI Premium la possibilité de produire des vidéos de huit secondes à partir d’images créées sur la plateforme.
Le moteur qui alimente cette fonctionnalité est le même modèle Veo 2 utilisé dans l’application Gemini, garantissant ainsi une cohérence technologique entre les différentes plateformes accessibles aux utilisateurs payants. La version actuelle ne comprend pas toutes les fonctionnalités initialement annoncées pour Veo 2. Les clips sont limités à une durée de huit secondes et à une résolution de 720p, bien en deçà de la capacité 4K du modèle.
Malgré ces restrictions, la possibilité de générer des vidéos dans Gemini pourrait inciter fortement à souscrire à l’offre Advanced. Étant donné la demande en ressources de la vidéo générée par IA, l’accès gratuit sur Gemini semble peu probable, ce qui accentue l’attrait de l’abonnement payant pour les créateurs ayant des besoins spécifiques.
Source : Blog Google
Commentaires 0
Soyez le premier à commenter !