Sana video : Efficient Text-to-Video and Image-to-Video by NVIDIA NVLabs
Sana videoは、効率的で高品質なテキストからビデオおよび画像からビデオの生成をブラウザにもたらします。研究に裏打ちされたパフォーマンスで、最大1分のコヒーレントな720p、16fpsのクリップを作成します。Story321でSana videoを試して、洗練されたモーションコンテンツを迅速に出荷しましょう。
Story321でSana videoを選ぶ理由
Story321は、Sana videoと、合理化されたUI、一貫性のあるデフォルト設定、バージョン管理された設定を組み合わせることで、面倒な設定やGPUの微調整ではなく、クリエイティブなディレクションに集中できるようにします。
一貫性のある動きと「ワールドシム」
安定した被写体、リアルな物理的な手がかり、そして信じられる動きとカメラワークのためのシーンの連続性をお楽しみください(nvlabs.github.io)。
スピードに合わせた適切な出力サイズ
720p、16fps、最大1分—ほとんどのクリエイティブなワークフローにとって、品質と反復速度の理想的なバランスです(nvlabs.github.io)。
ワークフローを重視した統合
バッチ処理、プリセットテンプレート、安全なデフォルト設定、そして迅速な再試行により、アイデアからエクスポートまでの摩擦を軽減します。
Story321上のSana videoは、高速で予測可能、かつ高品質なモーション結果を求めるクリエイターのために構築されています。
Sana videoのご紹介
Sana videoは、NVIDIA NVLabsが開発した、テキストからビデオ(T2V)および画像からビデオ(I2V)を生成する効率的な拡散モデルベースのビデオジェネレーターです。最大720pの解像度、16fps、最長1分の動画をサポートし、研究に裏打ちされた忠実度と一貫性のある動きを実現します(nvlabs.github.io • nvlabs.github.io)。
テキストからビデオ(T2V)
自然言語を鮮やかな動きに変えましょう。Sana videoは、多様なスタイルのナレーション、スムーズなトランジション、一貫した被写体をサポートし、高品質な720pのシーケンスを16fpsで生成します(nvlabs.github.io)。
画像からビデオ(I2V)
一枚の静止画をダイナミックなクリップにアニメーション化します。リアルな動き、カメラワーク、シーンの奥行きを追加しながら、アイデンティティと構成を維持します(nvlabs.github.io)。
効率的で実用的なランタイム
約60秒で5秒のクリップを生成、またはNVFP4最適化を施したRTX 5090では約29秒で生成できます。反復作業に十分な効率性です(youtube.com)。
オープンソースで研究に裏打ち
ICLR 2025で認められたSANAファミリー(Linear Diffusion Transformer)を基盤としており、探索と拡張のためのオープンソースコードも提供されています(nvlabs.github.io • research.nvidia.com • github.com)。
Sana videoで作成できるもの
ブランドのティーザーからチュートリアルのループまで、Sana videoはコンセプト作成とプロダクションレベルのモーションを加速します。
ローンチティーザー
制御されたカメラワークと一貫したブランディングで、5〜10秒のヒーローショットをカットします。
製品説明
読みやすいモーションビートと判読可能なクローズアップで、機能を説明します。
キャラクターの瞬間
単一の画像から、マスコットのジェスチャー、表情、およびマイクロ演技をアニメーション化します。
映画のようなBロール
様式化されたトランジション、状況設定ショット、およびアンビエントループを生成します。
ソーシャルトレンド
プラットフォームのペースに合わせた、パンチの効いた、ループ可能なクリップをプロトタイプします。
教育とハウツー
カメラの明瞭さと時間的な構造で、ステップバイステップのモーションを表示します。
プロのようにSana videoにプロンプトを入力する
明確な意図と時間的な手がかりは、Sana videoが一貫した動きとスタイルを提供するのに役立ちます。
強力なプロンプトの重要な要素
被写体 + アートディレクション
誰/何を、そして美学を定義します。キャラクターの特徴、素材、スタイルの基準となるものを指定します。
アクション + カメラ
動きとフレーミングを固定するために、動詞とカメラの言語を記述します。
環境 + ムード
フレーム全体で外観を安定させるために、空間、光、雰囲気を指定します。
時間的なビート
短いクリップで進行をガイドするために、開始/中間/終了のペースを追加します。
リファレンス優先のI2V
画像からビデオの場合、何を保持し、何をアニメーション化するかを記述します。
プロのヒント
冗長ではなく、明確に
短い、具体的な言い回しは、モーションコントロールにおいて、長い、詩的なテキストよりも優れています。
動きを時間に関連付ける
タイミングをクリップの長さに合わせるために、秒(「1秒保持」、「2秒かけて傾斜」)を使用します。
短いクリップで反復する
3〜5秒で洗練させます。Sana videoがあなたの意図に合致したら、アップスケールまたは拡張します。
プロンプトの改良例
"森の中を走るキツネ"
"赤いキツネが苔むした道を駆け抜ける;キツネの高さで安定したカメラ;朝霧;松の木漏れ日;最初はワイド、途中は追跡、最後はクローズアップ — Sana videoはフレーミングとモーションの手がかりを保持します"
"海岸線を走るスポーツカー"
"ヴィンテージの赤いスポーツカー、低いトラッキングショット、レンズフレア、海の崖;スムーズなロール;2つのカーブを通過;最後は崖の景色 — Sana videoは速度と構成を維持します"
Story321での使い方
Sana videoで一貫した結果を得るには、次の手順に従ってください。
モデルを選択
モデルリストからSana videoを選択します。
モードを選択
プロンプトにはText-to-Videoを使用し、リファレンスをアニメーション化するにはImage-to-Videoを使用します。
プロンプトの作成/リファレンスの設定
被写体、動き、カメラ、時間を記述します。I2Vの場合は画像をアップロードします。
期間、解像度、fpsを設定
バランスの取れた品質のために、最大60秒、720p、および16fpsを選択します。
コントロールを調整
モーションの強さ、カメラの揺れ、アスペクト比、および再現性のためのシードを調整します。
生成と洗練
プレビュー、トリミング、および短いクリップで反復します。ロックされたら拡張します。
ヒント
- •3〜5秒の長さで反復してから、30〜60秒に拡張します。
- •被写体の名前、スタイル、およびレンズの用語を、実行全体で一貫させます。
- •「1秒保持」のような時間の手がかりを使用して、ビートを安定させます。
- •I2Vのアイデンティティについては、鮮明で均等に照らされたリファレンスをアップロードします。
- •成功したプロンプトをSana videoのテンプレートとして整理します。
720p、16fps、最大1分などの仕様は、現在の公開されている研究ノートを反映しています。最新情報については、プロジェクトページをご覧ください([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/) • [github.com](https://github.com/NVlabs/Sana))。
よくある質問
Sana videoのセットアップとワークフローに関する一般的な質問への回答。
Sana videoで作成を開始しましょう
説得力のあるモーションコンテンツをプロトタイプ、反復、および公開します—Story321上のSana videoは、スピード、一貫性、および研究グレードの品質を提供します。
パフォーマンスと仕様は公開されている資料に基づいており、新しいリリースで進化する可能性があります([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/))。