12月16日、アリババは新世代の通義万象2.6モデルシリーズを正式にリリースしました。これは中国初のロールプレイング機能をサポートする動画生成モデルであり、1回の動画生成の長さは国内でトップの15秒に達します。
視聴覚の同期、マルチショット生成、音声駆動型動画作成などの複数の機能を統合したWan 2.6は、開発者によってグローバルな機能カバレッジの点で最も包括的な動画生成モデルの1つとして説明されています。
今回のアップデートは、単一の機能に対する漸進的な改善にとどまりません。代わりに、テキストから動画、画像から動画、テキストから画像など、5つの新しいモデルが同時に発表され、画像から動画生成までの主要な側面を網羅しています。これは、Wan 2.6がプロの映画制作と日常的な画像作成の両方を包括的にサポートできることを意味します。
01 3つのブレークスルー:Wan 2.6のコア機能#
Wan 2.6のブレークスルーは、生成時間の延長だけでなく、多機能統合とプロフェッショナルグレードの出力品質にもあります。
動画品質、サウンドエフェクト、指示の理解における包括的な改善に基づいて、新しいバージョンではロールプレイング機能とショット制御機能が導入され、中国で最もフル機能を備えた動画生成モデルとなっています。
9月にリリースされたWan 2.5と比較して、バージョン2.6は複数の側面で大幅な機能強化を実現しました。すでに権威あるLMArenaベンチマークで画像から動画生成において中国で1位を獲得していますが、2.6バージョンはこのリードをさらに押し広げています。
02 ロールプレイング:普通の人が自分の映画で主演できる#
Wan 2.6の最も目を引く機能は、中国における先駆的なロールプレイング機能です。この機能により、平均的なユーザーでも映画のような映像の中で素晴らしいパフォーマンスを披露できます。
ユーザーは、個人の動画をアップロードし、シナリオを説明するテキストプロンプトを入力するだけです。Wan 2.6は、ショットデザイン、キャラクターの演技、吹き替えなどのタスクを迅速に処理し、一貫性のあるナラティブと映画グレードの撮影を備えた完全な短編映画をわずか数分で生成し、ユーザーが映画スターになるという夢を実現するのに役立ちます。
技術的には、通義万象は複数の革新的な技術をモデルアーキテクチャに統合しています。入力された参照動画に対してマルチモーダルな共同モデリングと学習を実行し、被写体の感情、姿勢、多角的な視覚特性などの時間的に連続した特徴を分析すると同時に、音色やスピーチレートなどの音響特徴を抽出します。
03 ショット制御:マルチショットのナラティブを自動生成#
Wan 2.6のショット制御機能は、通常の動画生成ツールとは一線を画しています。この機能は、シンプルなユーザープロンプトをマルチショットスクリプトに変換し、複数のカメラショットで構成される一貫性のあるナラティブ動画を生成できます。
高レベルのセマンティック理解を利用して、通義万象は元の入力を完全なストーリーとナラティブな緊張感のあるプロフェッショナルなマルチショットセグメントに構築できます。ショットのシームレスな切り替え中に、コアとなる被写体、シーンレイアウト、環境の雰囲気を統一的にモデリングし、動画全体を通してコンテンツ、リズム、ムードの高い一貫性を保証します。
この機能により、Wan 2.6は複雑な映画言語の指示を理解して実行し、プロの写真家や編集者の作業を単一のコマンドで実行できます。
04 マルチオーディオドライブ:グローバルなユニークなイノベーション#
Wan 2.6は、最も包括的なグローバル機能を備えた動画生成モデルとしても認識されています。複数のオーディオトラックが、キャラクターの行動、口の動き、ショットのペースに影響を与える「駆動信号」として機能する「マルチオーディオドライブ」機能を組み込んでいることで知られており、より自然な視聴覚同期のために、単純なポストプロダクションの吹き替えを超えています。
この技術的なハイライトにより、Wan 2.6はよりリアルな視聴覚同期効果を実現できます。参照動画に対してマルチモーダルな共同モデリングを実行し、時間的な視覚特徴と音響特徴を同時に抽出することにより、モデルは生成プロセス中に画像とサウンドの完全な感覚的一貫性の移行を実現します。
05 実用的なアプリケーションシナリオ:個人的なエンターテインメントからプロの制作まで#
Wan 2.6の登場は、動画制作の障壁をさらに下げ、AI動画生成のアプリケーションの境界を拡大します。
個々のユーザーにとって、Wan 2.6は非常に魅力的なエンターテインメント体験を提供します。個人の動画をアップロードし、テキストプロンプトを入力するだけで、SFやサスペンスクリップなど、自分自身が主演するクリエイティブな短編映画を生成できます。
広告デザインやショートドラマ制作などのプロの制作分野では、Wan 2.6は連続したプロンプトに基づいて完全なナラティブ短編映画を生成できます。
たとえば、広告コンセプトを説明するプロンプトを入力すると、Wan 2.6はキャラクターと製品をフィーチャーしたコマーシャル動画を制作し、複数のショット変更にわたって被写体やシーンなどの主要な情報の一貫性を維持します。
現在、Wanxiangモデルファミリーは、テキストから画像、画像編集、テキストから動画、画像から動画、ロールプレイングなど、10種類以上の異なる視覚的作成機能をサポートしています。AIコミックシリーズ、広告デザイン、ショートビデオ制作などの分野ですでに広く使用されています。
06 アクセス方法:便利なマルチプラットフォーム体験#
Wan 2.6は現在、複数のプラットフォームで利用可能であり、ユーザーに多様なアクセス方法を提供しています。
- 通義万象公式サイト:個々のユーザーは、公式サイトで基本的な機能を無料で直接体験できます。
- Alibaba Cloud Bailianプラットフォーム:企業や開発者が独自のアプリケーションに統合するためのAPIインターフェースを提供します。
- story321.comプラットフォーム:ユーザーは、AIストーリー生成に焦点を当てたこのプラットフォームでWan 2.6を利用することもできます。特にナラティブコンテンツの生成に最適化されており、ショートビデオストーリー、アニメーション、および同様のコンテンツの作成に適しています。
プロのユーザーおよび企業の場合、より安定したパフォーマンスとサポートのために、Alibaba Cloud Bailianプラットフォームを介してAPIサービスにアクセスすることをお勧めします。個々のユーザーおよびクリエイティブな愛好家の場合、Wanxiang公式サイトとstory321.comは、体験のためのゼロしきい値の機会を提供します。Story321.comは、特に一貫性のあるストーリーコンテンツを作成したいユーザーにとって理想的な選択肢です。
Wan 2.6の登場は、AI動画生成技術が単純な画像シーケンス作成から、包括的な映画制作の新しい段階に進化したことを意味します。プロの動画制作の敷居を下げるだけでなく、「誰もが監督になれる」というビジョンを実現し、誰もが自分の創造性を便利に表現できるようにします。
現在、Wan 2.6はAlibaba Cloud Bailian、通義万象公式サイト、およびstory321.comプラットフォームで利用可能です。誰もがこれらのプラットフォームで直接体験でき、エンタープライズユーザーはAlibaba Cloud Bailianを介してモデルAPIを呼び出すこともできます。Qianwen APPも間もなくモデルをリリースし、より豊富なインタラクション方法を提供すると報告されています。



