Efficient Text-to-Video and Image-to-Video by NVIDIA NVLabs
Sana 影片將高效、高品質的文字轉影片和圖片轉影片產生帶到您的瀏覽器。使用研究支援的效能創建連貫的 720p、16 fps 片段,最長可達一分鐘。在 Story321 上試用 Sana 影片,並快速發布精美的動作內容。

Sana 影片是 NVIDIA NVLabs 基於擴散的高效率影片產生器,適用於文字轉影片 (T2V) 和圖片轉影片 (I2V),支援高達 720p 解析度、16 fps 和長達一分鐘的影片,並具有研究支援的逼真度和連貫的動作 ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/) • [nvlabs.github.io](https://nvlabs.github.io/Sana/)).
將自然語言轉化為生動的動作。Sana 影片支援多風格敘事、流暢的轉場和一致的主題,以 16 fps 的速度產生高品質的 720p 序列 ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/)).
將單一畫面製作成動態片段。在添加逼真的動作、相機移動和場景深度時,保留身份和構圖 ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/)).
大約 60 秒即可產生 5 秒的片段,或在具有 NVFP4 優化的 RTX 5090 上約 29 秒——效率足以進行迭代循環 ([youtube.com](https://www.youtube.com/watch?v=JmHxYDpCVX8)).
建立在 SANA 系列(線性擴散轉換器)之上,並獲得 ICLR 2025 的認可,加上用於探索和擴展的開源程式碼 ([nvlabs.github.io](https://nvlabs.github.io/Sana/) • [research.nvidia.com](https://research.nvidia.com/labs/eai/publication/sana/) • [github.com](https://github.com/NVlabs/Sana)).
按照以下步驟使用 Sana 影片產生一致的結果。
從模型列表中選擇 Sana 影片。
使用文字轉影片進行提示,或使用圖片轉影片來動畫化參考。
描述主體、動作、相機、時間;上傳 I2V 的圖像。
選擇最長 60 秒、720p 和 16 fps 以獲得平衡的品質。
調整動作強度、相機抖動、長寬比和種子以實現可重複性。
預覽、修剪並在短片中迭代;鎖定後延長。
720p、16 fps 和最長 1 分鐘等規格反映了當前的公開研究筆記;有關更新,請參閱專案頁面 ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/) • [github.com](https://github.com/NVlabs/Sana)).
從品牌預告片到教學循環,Sana 影片可加速概念化和生產級動作。
剪輯 5-10 秒的英雄鏡頭,具有受控的相機移動和一致的品牌形象。
通過可讀的動作節拍和清晰的特寫鏡頭演示功能。
從單一圖像中動畫化吉祥物手勢、表情和微動作。
產生風格化的轉場、建立鏡頭和環境循環。
原型設計與平台節奏相符的有力、可循環的片段。
通過相機清晰度和時間結構顯示逐步動作。
常見 Sana 影片設定和工作流程問題的解答。
根據公開文件,每個片段最高 720p 解析度、16 fps 和 1 分鐘的持續時間 ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/)).
5 秒片段約 60 秒,或在具有 NVFP4 優化的 RTX 5090 上約 29 秒 ([youtube.com](https://www.youtube.com/watch?v=JmHxYDpCVX8)).
程式碼和研究資源可用於探索 ([github.com](https://github.com/NVlabs/Sana) • [research.nvidia.com](https://research.nvidia.com/labs/eai/publication/sana/)).
T2V 從文字創建動作;I2V 動畫化提供的圖像,同時保留身份和佈局。
可以——在提示中使用鏡頭、拍攝類型和移動術語(例如,「低追蹤鏡頭」、「輕柔的推入」)。
在商業使用之前,請查看儲存庫的許可證和任何第三方條款 ([github.com](https://github.com/NVlabs/Sana)).
原型設計、迭代和發布引人注目的動作內容——Story321 上的 Sana 影片為您提供速度、連貫性和研究級品質。
效能和規格基於公開材料,可能會隨著新版本而發展 ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/)).