S

Sana video : Efficient Text-to-Video and Image-to-Video by NVIDIA NVLabs

Sana 影片將高效、高品質的文字轉影片和圖片轉影片產生帶到您的瀏覽器。使用研究支援的效能創建連貫的 720p、16 fps 片段,最長可達一分鐘。在 Story321 上試用 Sana 影片,並快速發布精美的動作內容。

為什麼選擇 Story321 上的 Sana 影片

Story321 將 Sana 影片與簡化的 UI、一致的預設值和版本化的設定配對,因此您可以專注於創意指導,而不是管道或 GPU 微調。

連貫的動作和「世界模擬」

享受穩定的主體、逼真的物理提示和場景連續性,以實現可信的動作和相機移動 (nvlabs.github.io).

適合速度的輸出尺寸

720p、16 fps、最長 1 分鐘——在品質和迭代速度之間取得理想的平衡,適用於大多數創意工作流程 (nvlabs.github.io).

工作流程優先的整合

批次執行、預設範本、安全預設值和快速重試可減少從想法到匯出的摩擦。

Story321 上的 Sana 影片專為想要快速、可預測、高品質動作結果的創作者而打造。

認識 Sana 影片

Sana 影片是 NVIDIA NVLabs 基於擴散的高效率影片產生器,適用於文字轉影片 (T2V) 和圖片轉影片 (I2V),支援高達 720p 解析度、16 fps 和長達一分鐘的影片,並具有研究支援的逼真度和連貫的動作 (nvlabs.github.ionvlabs.github.io).

文字轉影片 (T2V)

將自然語言轉化為生動的動作。Sana 影片支援多風格敘事、流暢的轉場和一致的主題,以 16 fps 的速度產生高品質的 720p 序列 (nvlabs.github.io).

圖片轉影片 (I2V)

將單一畫面製作成動態片段。在添加逼真的動作、相機移動和場景深度時,保留身份和構圖 (nvlabs.github.io).

高效、實用的運行時間

大約 60 秒即可產生 5 秒的片段,或在具有 NVFP4 優化的 RTX 5090 上約 29 秒——效率足以進行迭代循環 (youtube.com).

開源且有研究支持

建立在 SANA 系列(線性擴散轉換器)之上,並獲得 ICLR 2025 的認可,加上用於探索和擴展的開源程式碼 (nvlabs.github.ioresearch.nvidia.comgithub.com).

您可以使用 Sana 影片創建什麼

從品牌預告片到教學循環,Sana 影片可加速概念化和生產級動作。

發布預告片

剪輯 5-10 秒的英雄鏡頭,具有受控的相機移動和一致的品牌形象。

產品說明

通過可讀的動作節拍和清晰的特寫鏡頭演示功能。

角色時刻

從單一圖像中動畫化吉祥物手勢、表情和微動作。

電影 B 卷

產生風格化的轉場、建立鏡頭和環境循環。

社交趨勢

原型設計與平台節奏相符的有力、可循環的片段。

教育與操作指南

通過相機清晰度和時間結構顯示逐步動作。

像專業人士一樣提示 Sana 影片

清晰的意圖和時間提示有助於 Sana 影片提供一致的動作和風格。

強提示的關鍵要素

主體 + 美術指導

定義誰/什麼,加上美學。命名角色特徵、材料和風格錨點。

Example: 一個陶瓷機器人咖啡師,20 世紀中葉的咖啡館,柔和的調色板,柔和的輪廓光,散景高光

動作 + 相機

描述動詞和相機語言以鎖定動作和取景。

Example: 機器人倒入拿鐵藝術;手持中景鏡頭,輕柔的推軌鏡頭,輕微的視差,淺景深

環境 + 氣氛

指定空間、光線和氛圍以穩定跨畫面的外觀。

Example: 黃金時段,溫暖的主光,體積塵埃微粒,反光瓷磚,霓虹燈閃爍

時間節拍

添加開始/中間/結束節奏以引導短片中的進展。

Example: 開始穩定;中間倒入;結束揭示漩渦,保持 1 秒

參考優先的 I2V

對於圖片轉影片,請說明要保留什麼與要動畫化什麼。

Example: 保持臉部和服裝;在頭髮中添加風;緩慢的推入;到最後露出微妙的微笑

專業提示

明確,不要冗長

簡短、具體的措辭優於用於動作控制的長而富詩意的文字。

將動作與時間聯繫起來

使用秒數(「保持 1 秒」、「在 2 秒內加速」),以便時間與片段長度對應。

在短片中迭代

在 3-5 秒內細化;在 Sana 影片符合您的意圖後,放大或延長。

提示細化範例

基本

"一隻狐狸在森林裡奔跑"

增強

"一隻紅狐狸沿著苔蘚小路衝刺;穩定的攝影機位於狐狸的高度;早晨的薄霧;穿過松樹的陽光;開始時寬廣,中間追逐,結束時特寫——Sana 影片保持取景和動作提示"

基本

"一輛跑車在沿海公路上"

增強

"老式紅色跑車,低追蹤鏡頭,鏡頭光暈,海洋懸崖;平穩滾動;通過兩個彎道;結束於懸崖景色——Sana 影片保持速度和構圖"

如何在 Story321 上使用

按照以下步驟使用 Sana 影片產生一致的結果。

1

選擇模型

從模型列表中選擇 Sana 影片。

2

選擇模式

使用文字轉影片進行提示,或使用圖片轉影片來動畫化參考。

3

編寫提示/設定參考

描述主體、動作、相機、時間;上傳 I2V 的圖像。

4

設定持續時間、解析度、fps

選擇最長 60 秒、720p 和 16 fps 以獲得平衡的品質。

5

調整控制項

調整動作強度、相機抖動、長寬比和種子以實現可重複性。

6

產生和細化

預覽、修剪並在短片中迭代;鎖定後延長。

提示

  • 在延長到 30-60 秒之前,以 3-5 秒的長度迭代。
  • 在多次運行中保持主體名稱、樣式和鏡頭術語一致。
  • 使用「保持 1 秒」等時間提示來穩定節拍。
  • 對於 I2V 身份,上傳清晰、光線均勻的參考。
  • 將成功的提示組織為 Sana 影片的範本。

720p、16 fps 和最長 1 分鐘等規格反映了當前的公開研究筆記;有關更新,請參閱專案頁面 ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/) • [github.com](https://github.com/NVlabs/Sana)).

FAQ

常見問題解答

常見 Sana 影片設定和工作流程問題的解答。

開始使用 Sana 影片創作

原型設計、迭代和發布引人注目的動作內容——Story321 上的 Sana 影片為您提供速度、連貫性和研究級品質。

效能和規格基於公開材料,可能會隨著新版本而發展 ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/)).