Efficient Text-to-Video and Image-to-Video by NVIDIA NVLabs
Sana video 将高效、高质量的文本到视频和图像到视频生成带到您的浏览器。创建连贯的 720p、16 fps 剪辑,最长可达一分钟,并具有研究支持的性能。在 Story321 上试用 Sana video 并快速发布精美的运动内容。

Sana video 是 NVIDIA NVLabs 基于扩散模型的高效视频生成器,用于文本到视频 (T2V) 和图像到视频 (I2V),支持高达 720p 分辨率、16 fps 和最长一分钟的持续时间,并具有研究支持的保真度和连贯的运动 ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/) • [nvlabs.github.io](https://nvlabs.github.io/Sana/)).
将自然语言转化为生动的动态影像。Sana video 支持多风格叙事、流畅过渡和一致的主题,以 16 fps 的速度生成高质量的 720p 序列 ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/)).
将单帧图像制作成动态短片。在添加逼真的运动、相机移动和场景深度的同时,保留身份和构图 ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/)).
生成一个 5 秒的片段大约需要 60 秒,或者在配备 NVFP4 优化的 RTX 5090 上大约需要 29 秒——效率足以支持迭代循环 ([youtube.com](https://www.youtube.com/watch?v=JmHxYDpCVX8)).
基于 SANA 系列(线性扩散转换器),并获得 ICLR 2025 的认可,加上用于探索和扩展的开源代码 ([nvlabs.github.io](https://nvlabs.github.io/Sana/) • [research.nvidia.com](https://research.nvidia.com/labs/eai/publication/sana/) • [github.com](https://github.com/NVlabs/Sana)).
按照以下步骤使用 Sana video 产生一致的结果。
从模型列表中选择 Sana video。
使用文本到视频进行提示,或使用图像到视频来动画化参考。
描述主体、运动、相机、时间;上传 I2V 的图像。
选择高达 60 秒、720p 和 16 fps 以获得平衡的质量。
调整运动强度、相机抖动、宽高比和种子以实现可重复性。
预览、修剪并在短片中迭代;锁定后扩展。
诸如 720p、16 fps 和最长 1 分钟之类的规格反映了当前公开的研究说明;有关更新,请参阅项目页面 ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/) • [github.com](https://github.com/NVlabs/Sana)).
从品牌预告片到教程循环,Sana video 加速了概念设计和生产级运动。
剪辑 5-10 秒的英雄镜头,具有受控的相机移动和一致的品牌形象。
通过可读的运动节拍和清晰的特写镜头演示功能。
从单张图像中动画化吉祥物手势、表情和微表情。
生成风格化的过渡、场景镜头和环境循环。
原型设计与平台节奏相匹配的简洁、可循环的剪辑。
通过相机清晰度和时间结构显示逐步运动。
常见 Sana video 设置和工作流程问题的解答。
根据公开文档,每个剪辑最高 720p 分辨率、16 fps 和 1 分钟持续时间 ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/)).
大约 60 秒生成一个 5 秒的剪辑,或者在配备 NVFP4 优化的 RTX 5090 上大约 29 秒 ([youtube.com](https://www.youtube.com/watch?v=JmHxYDpCVX8)).
代码和研究资源可用于探索 ([github.com](https://github.com/NVlabs/Sana) • [research.nvidia.com](https://research.nvidia.com/labs/eai/publication/sana/)).
T2V 从文本创建运动;I2V 在保留身份和布局的同时动画化提供的图像。
是的——在提示中使用镜头、拍摄类型和运动术语(例如,“低角度跟踪镜头”、“轻柔的推轨镜头”)。
在商业使用之前,请查看存储库的许可证和任何第三方条款 ([github.com](https://github.com/NVlabs/Sana)).
原型设计、迭代和发布引人注目的运动内容——Story321 上的 Sana video 为您提供速度、连贯性和研究级别的质量。
性能和规格基于公开材料,可能会随着新版本的发布而发展 ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/)).