Google a présenté une nouvelle mise à jour de Veo 3.1, son modèle d’intelligence artificielle pour la génération vidéo, qui permet désormais de transformer des photographies en clips verticaux prêts à être publiés sur des réseaux sociaux tels que TikTok, Instagram ou YouTube Shorts.
Cette nouveauté marque une étape importante dans la stratégie de l’entreprise visant à faciliter la création de contenus audiovisuels grâce à l’IA et à concurrencer directement sur un marché dominé par les formats courts et verticaux.
Cette fonctionnalité est diffusée via « Ingredients to Video », un outil intégré à l’écosystème Veo qui combine des images de référence avec des instructions écrites pour générer automatiquement des vidéos. Avec cette mise à jour, Google a permis pour la première fois la création native de vidéos au format 9:16, la norme des principales plateformes sociales. Selon la société, cela évite des coupes, des pertes de qualité ou des adaptations forcées du contenu original.
Dans une publication officielle, Google a expliqué que cette amélioration permet la production de récits verticaux de haute qualité, en plein écran, conçus spécifiquement pour la consommation mobile. L’entreprise affirme que cet outil peut être utilisé à la fois pour du contenu informel et des projets plus élaborés, sans nécessiter de connaissances techniques avancées en montage vidéo.
Jusqu’à présent, des plateformes comme CapCut proposaient déjà l’intégration avec des modèles de génération vidéo comme Sora 2 ou les versions précédentes de Veo, mais n’autorisaient pas le téléchargement d’images personnelles comme base pour créer des extraits. Cette limitation était due au fait que l’utilisation des photos de référence était limitée à « Ingrédients vers la vidéo », une fonctionnalité qui s’élargit et devient plus accessible grâce à cette mise à jour.
En plus du support des vidéos verticales, Veo 3.1 intègre des améliorations de cohérence visuelle. Google a indiqué que le modèle maintient désormais plus systématiquement l’identité des personnes et des personnages lorsqu’ils changent de décor, ainsi que la continuité des arrière-plans et des objets. Le système ajuste automatiquement des paramètres tels que l’éclairage, la tonalité et la silhouette afin que les éléments ne paraissent pas déplacés dans la même séquence.
Une autre avancée remarquable est la capacité à synthétiser visuellement. Cette fonctionnalité vous permet de combiner des images avec différents styles, textures ou caractéristiques en une seule vidéo cohérente. Pour y parvenir, l’utilisateur doit préciser dans le texte d’instructions quel style doit prédominer et comment les différents éléments visuels doivent être intégrés, élargissant ainsi les possibilités créatives du modèle.
En termes de qualité, la mise à niveau augmente également la résolution de sortie. Veo 3.1 est déjà capable de générer des vidéos en 1080p et 4K. Google a noté que les clips 1080p offrent une image plus nette et nette, tandis que les vidéos 4K utilisent des techniques avancées d’upscaling pour mieux capturer les détails et les textures, même dans des contenus courts.
La nouvelle fonctionnalité permettant de créer des vidéos verticales à partir de photos sera disponible aujourd’hui sur l’application mobile Gemini. Google a intégré « Ingredients to Video » directement dans l’application afin que davantage d’utilisateurs puissent expérimenter cette technologie sans recourir à des outils externes. La fonctionnalité a également été intégrée à YouTube Create et à l’écosystème Shorts.
Pour ceux qui ont besoin de résolutions plus élevées ou d’utilisation plus avancée, Google a rendu accessible via Flow, l’API Gemini, Vertex AI et Google Vids. Ces options sont destinées aux créateurs professionnels, aux entreprises et aux développeurs souhaitant intégrer la génération de vidéos IA dans des flux de travail plus complexes.
En plus de ces nouvelles fonctionnalités, la société a annoncé l’intégration d’une étiquette d’identification dans les vidéos générées avec Veo 3.1. Il s’agit de SynthID, un filigrane invisible à l’œil humain qui permet d’identifier le contenu créé grâce à l’intelligence artificielle. L’objectif, selon Google, est de réduire la désinformation et d’offrir une plus grande transparence sur l’origine des contenus audiovisuels.
Les utilisateurs pourront vérifier si une vidéo a été générée par IA via l’application Gemini, une initiative qui renforce les efforts de l’entreprise pour établir des normes de responsabilité dans l’utilisation des technologies génératives. Cette approche devient pertinente dans un contexte où les vidéos synthétiques deviennent de plus en plus réalistes et difficiles à distinguer des vraies.
En savoir plus sur Gnatepe
Subscribe to get the latest posts sent to your email.






