Efficient Text-to-Video and Image-to-Video by NVIDIA NVLabs
Sana video apporte une génération de texte-vers-vidéo et d'image-vers-vidéo efficace et de haute qualité à votre navigateur. Créez des clips cohérents de 720p, 16 fps jusqu'à une minute avec des performances soutenues par la recherche. Essayez Sana video sur Story321 et livrez rapidement du contenu de mouvement soigné.

Sana video est le générateur vidéo efficace basé sur la diffusion de NVIDIA NVLabs pour le texte-vers-vidéo (T2V) et l'image-vers-vidéo (I2V), prenant en charge une résolution allant jusqu'à 720p, 16 fps et des durées allant jusqu'à une minute, avec une fidélité et un mouvement cohérent soutenus par la recherche ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/) • [nvlabs.github.io](https://nvlabs.github.io/Sana/)).
Transformez le langage naturel en mouvement saisissant. Sana video prend en charge les récits multi-styles, les transitions fluides et les sujets cohérents, produisant des séquences 720p de haute qualité à 16 fps ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/)).
Animez une seule image en un clip dynamique. Préservez l'identité et la composition tout en ajoutant un mouvement réaliste, des mouvements de caméra et une profondeur de scène ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/)).
Générez un clip de 5 secondes en environ 60 secondes, ou ~29 secondes sur RTX 5090 avec les optimisations NVFP4—suffisamment efficace pour les boucles d'itération ([youtube.com](https://www.youtube.com/watch?v=JmHxYDpCVX8)).
Construit sur la famille SANA (Linear Diffusion Transformer) avec la reconnaissance ICLR 2025, plus un code open-source pour l'exploration et les extensions ([nvlabs.github.io](https://nvlabs.github.io/Sana/) • [research.nvidia.com](https://research.nvidia.com/labs/eai/publication/sana/) • [github.com](https://github.com/NVlabs/Sana)).
Suivez ces étapes pour produire des résultats cohérents avec Sana video.
Choisissez Sana video dans la liste des modèles.
Utilisez Texte-vers-Vidéo pour les invites, ou Image-vers-Vidéo pour animer une référence.
Décrivez le sujet, le mouvement, la caméra, le temps ; téléchargez une image pour I2V.
Choisissez jusqu'à 60 secondes, 720p et 16 fps pour une qualité équilibrée.
Ajustez la force du mouvement, la gigue de la caméra, le rapport hauteur/largeur et la graine pour la reproductibilité.
Prévisualisez, coupez et itérez dans des clips courts ; prolongez une fois verrouillé.
Les spécifications telles que 720p, 16 fps et jusqu'à 1 minute reflètent les notes de recherche publiques actuelles ; consultez les pages du projet pour les mises à jour ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/) • [github.com](https://github.com/NVlabs/Sana)).
Des teasers de marque aux boucles de tutoriel, Sana video accélère la conception et le mouvement de qualité production.
Coupez des plans de héros de 5 à 10 secondes avec des mouvements de caméra contrôlés et une image de marque cohérente.
Démontrez les fonctionnalités avec des rythmes de mouvement lisibles et des gros plans lisibles.
Animez les gestes de la mascotte, les expressions et le micro-jeu à partir d'une seule image.
Générez des transitions stylisées, des plans d'établissement et des boucles ambiantes.
Prototypez des clips percutants et bouclables qui correspondent au rythme de la plateforme.
Montrez le mouvement étape par étape avec la clarté de la caméra et la structure temporelle.
Réponses aux questions courantes sur la configuration et le flux de travail de Sana video.
Jusqu'à une résolution de 720p, 16 fps et une durée de 1 minute par clip, selon les documents publics ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/)).
Environ 60 secondes pour un clip de 5 secondes, ou ~29 secondes sur RTX 5090 avec les optimisations NVFP4 ([youtube.com](https://www.youtube.com/watch?v=JmHxYDpCVX8)).
Le code et les ressources de recherche sont disponibles pour l'exploration ([github.com](https://github.com/NVlabs/Sana) • [research.nvidia.com](https://research.nvidia.com/labs/eai/publication/sana/)).
T2V crée du mouvement à partir de texte ; I2V anime une image fournie tout en préservant l'identité et la mise en page.
Oui —utilisez les termes d'objectif, de type de plan et de mouvement (par exemple, « plan de suivi bas », « doux travelling avant ») dans l'invite.
Consultez la licence du référentiel et toutes les conditions générales tierces avant toute utilisation commerciale ([github.com](https://github.com/NVlabs/Sana)).
Prototypez, itérez et publiez du contenu de mouvement convaincant —Sana video sur Story321 vous offre vitesse, cohérence et qualité de niveau recherche.
Les performances et les spécifications sont basées sur des documents publics et peuvent évoluer avec les nouvelles versions ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/)).