Alibaba Lance Wan 2.6 : L'Ère Où Tout le Monde Peut Être Réalisateur Arrive Officiellement

Alibaba Lance Wan 2.6 : L'Ère Où Tout le Monde Peut Être Réalisateur Arrive Officiellement

6 min read

Le 16 décembre, Alibaba a officiellement lancé la nouvelle génération de modèles Tongyi Wanxiang 2.6. Il s'agit du premier modèle de génération de vidéos en Chine à prendre en charge une fonction de jeu de rôle, avec une durée de génération de vidéo unique atteignant 15 secondes, ce qui est un record national.

Intégrant de multiples fonctions telles que la synchronisation audio-visuelle, la génération multi-plans et la création de vidéos pilotées par l'audio, Wan 2.6 est décrit par ses développeurs comme l'un des modèles de génération de vidéos les plus complets en termes de couverture de fonctionnalités à l'échelle mondiale.

Cette mise à jour n'est pas simplement une amélioration progressive d'une seule capacité ; au contraire, cinq nouveaux modèles ont été lancés simultanément, notamment texte-vers-vidéo, image-vers-vidéo et texte-vers-image, couvrant les aspects clés de la génération d'images à la vidéo. Cela signifie que Wan 2.6 peut fournir un support complet à la fois pour la production cinématographique professionnelle et la création d'images quotidienne.


01 Trois Percées : Les Capacités Essentielles de Wan 2.6#

Try it

La percée de Wan 2.6 ne réside pas seulement dans l'augmentation de la durée de génération, mais aussi dans son intégration multifonctionnelle et sa qualité de sortie de niveau professionnel.

S'appuyant sur des améliorations complètes de la qualité vidéo, des effets sonores et du suivi des instructions, la nouvelle version introduit des fonctions de jeu de rôle et de contrôle des plans, ce qui en fait le modèle de génération de vidéos le plus complet en Chine.

Par rapport à Wan 2.5, sorti en septembre, la version 2.6 a réalisé des améliorations significatives dans de multiples dimensions. Ayant déjà été classée première en Chine pour la génération d'images vers vidéo sur le benchmark faisant autorité LMArena, la version 2.6 pousse encore plus loin cette avance.

02 Jeu de Rôle : Les Gens Ordinaires Peuvent Jouer dans Leurs Propres Films#

La caractéristique la plus frappante de Wan 2.6 est sa capacité de jeu de rôle pionnière en Chine. Cette fonction permet aux utilisateurs moyens de réaliser des performances exceptionnelles dans des séquences de qualité cinématographique.

Un utilisateur a simplement besoin de télécharger une vidéo personnelle et de saisir une invite textuelle décrivant un scénario. Wan 2.6 peut alors rapidement gérer des tâches telles que la conception des plans, le jeu des personnages et le doublage, générant un court métrage complet avec une narration cohérente et une cinématographie de qualité cinématographique en quelques minutes seulement, aidant ainsi les utilisateurs à réaliser leur rêve de devenir une star de cinéma.

Techniquement, Tongyi Wanxiang a intégré de multiples technologies innovantes dans l'architecture du modèle. Il effectue une modélisation et un apprentissage conjoints multi-modaux sur la vidéo de référence en entrée, analysant les caractéristiques temporellement séquentielles telles que l'émotion du sujet, la posture et les caractéristiques visuelles multi-angles, tout en extrayant également les caractéristiques acoustiques telles que le timbre et le débit de parole.

03 Contrôle des Plans : Génération Automatique de Narrations Multi-Plans#

La capacité de contrôle des plans de Wan 2.6 le distingue des outils de génération de vidéos ordinaires. Cette fonctionnalité peut transformer de simples invites utilisateur en scripts multi-plans, produisant des vidéos narratives cohérentes composées de plusieurs prises de vue.

Utilisant une compréhension sémantique de haut niveau, Tongyi Wanxiang peut construire l'entrée originale en segments multi-plans professionnels avec des scénarios complets et une tension narrative. Lors de la commutation transparente des plans, il maintient une modélisation unifiée du sujet central, de la disposition de la scène et de l'atmosphère environnementale, assurant une grande cohérence dans le contenu, le rythme et l'ambiance tout au long de la vidéo.

Cette fonctionnalité permet à Wan 2.6 de comprendre et d'exécuter des instructions complexes de langage cinématographique, accomplissant le travail de photographes et de monteurs professionnels avec une seule commande.

04 Multi-Audio Drive : Une Innovation Mondiale Unique#

Wan 2.6 est également reconnu comme un modèle de génération de vidéos avec la fonctionnalité mondiale la plus complète. Il est noté pour l'incorporation d'une fonctionnalité "multi-audio drive", où plusieurs pistes audio peuvent agir comme des "signaux de pilotage" influençant les actions des personnages, les mouvements de la bouche et le rythme des plans, allant au-delà du simple doublage de post-production pour une synchronisation audio-visuelle plus naturelle.

Ce point fort technique permet à Wan 2.6 d'obtenir des effets de synchronisation audio-visuelle plus réalistes. En effectuant une modélisation conjointe multi-modale sur la vidéo de référence et en extrayant simultanément les caractéristiques visuelles temporelles et les caractéristiques acoustiques, le modèle réalise une migration complète de la cohérence sensorielle de l'image et du son pendant le processus de génération.

05 Scénarios d'Application Pratiques : Du Divertissement Personnel à la Création Professionnelle#

L'émergence de Wan 2.6 abaissera davantage la barrière à la création vidéo et étendra les limites d'application de la génération vidéo par l'IA.

Pour les utilisateurs individuels, Wan 2.6 offre une expérience de divertissement très attrayante. En téléchargeant simplement une vidéo personnelle et en entrant une invite textuelle, les utilisateurs peuvent générer des courts métrages créatifs dans lesquels ils jouent, tels que des clips de science-fiction ou de suspense.

Dans le domaine de la création professionnelle, comme la conception publicitaire et la production de courts métrages, Wan 2.6 peut générer des courts métrages narratifs complets basés sur des invites séquentielles.

Par exemple, la saisie d'une invite décrivant un concept publicitaire permet à Wan 2.6 de produire une vidéo commerciale mettant en scène des personnages et des produits, tout en maintenant la cohérence des informations clés telles que le sujet et la scène à travers de multiples changements de plans.

Actuellement, la famille de modèles Wanxiang prend en charge plus de 10 capacités de création visuelle différentes, notamment le texte-vers-image, l'édition d'images, le texte-vers-vidéo, l'image-vers-vidéo et le jeu de rôle. Elle est déjà largement utilisée dans des domaines tels que les séries de bandes dessinées IA, la conception publicitaire et la création de courtes vidéos.

06 Comment Accéder : Expérience Multi-Plateforme Pratique#

Wan 2.6 est maintenant disponible sur de multiples plateformes, offrant aux utilisateurs divers choix d'accès :

  • Site Web Officiel de Tongyi Wanxiang : Les utilisateurs individuels peuvent directement expérimenter gratuitement les fonctions de base sur le site web officiel.
  • Plateforme Alibaba Cloud Bailian : Fournit des interfaces API pour que les entreprises et les développeurs puissent les intégrer dans leurs propres applications.
  • Plateforme story321.com : Les utilisateurs peuvent également utiliser Wan 2.6 sur cette plateforme axée sur la génération d'histoires par l'IA. Elle est particulièrement optimisée pour la génération de contenu narratif, ce qui la rend adaptée à la création de courtes histoires vidéo, d'animations et de contenus similaires.

Pour les utilisateurs professionnels et les entreprises, il est recommandé d'accéder aux services API via la plateforme Alibaba Cloud Bailian pour une performance et un support plus stables. Pour les utilisateurs individuels et les passionnés de création, le site web officiel de Wanxiang et story321.com offrent des opportunités d'expérience sans seuil. Story321.com est un choix idéal, en particulier pour les utilisateurs souhaitant créer un contenu d'histoire cohérent.


L'arrivée de Wan 2.6 signifie que la technologie de génération de vidéos par l'IA a évolué, passant de la simple création de séquences d'images à une nouvelle étape de création cinématographique complète. Elle abaisse non seulement le seuil de la production vidéo professionnelle, mais permet également à chacun d'exprimer sa créativité de manière pratique, réalisant ainsi la vision selon laquelle "tout le monde peut être réalisateur".

Actuellement, Wan 2.6 est disponible sur Alibaba Cloud Bailian, le site web officiel de Tongyi Wanxiang et la plateforme story321.com. Tout le monde peut en faire l'expérience directement sur ces plateformes, et les utilisateurs professionnels peuvent également appeler l'API du modèle via Alibaba Cloud Bailian. Il est rapporté que l'application Qianwen lancera également le modèle prochainement, offrant des moyens plus riches d'interagir avec lui.

S
Author

Story321 AI Blog Team is dedicated to providing in-depth, unbiased evaluations of technology products and digital solutions. Our team consists of experienced professionals passionate about sharing practical insights and helping readers make informed decisions.

Start Creating with AI

Transform your creative ideas into reality with Story321 AI tools

Get Started Free

Related Articles