S

Sana video : Efficient Text-to-Video and Image-to-Video by NVIDIA NVLabs

Sana video menghadirkan pembuatan text-to-video dan image-to-video yang efisien dan berkualitas tinggi ke browser Anda. Buat klip 720p, 16 fps yang koheren hingga satu menit dengan kinerja yang didukung oleh penelitian. Coba Sana video di Story321 dan kirim konten gerakan yang dipoles dengan cepat.

Kenapa pilih Sana video di Story321

Story321 memasangkan Sana video dengan UI yang disederhanakan, default yang konsisten, dan pengaturan versi sehingga Anda dapat fokus pada arahan kreatif, bukan urusan teknis atau micro-tuning GPU.

Gerakan koheren dan ‘Simulasi Dunia’

Nikmati subjek yang stabil, isyarat fisika yang realistis, dan kesinambungan adegan untuk gerakan dan gerakan kamera yang meyakinkan (nvlabs.github.io).

Output ukuran pas untuk kecepatan

720p, 16 fps, hingga 1 menit—keseimbangan ideal antara kualitas dan kecepatan iterasi untuk sebagian besar alur kerja kreatif (nvlabs.github.io).

Integrasi yang mengutamakan alur kerja

Batch run, templat preset, default yang aman, dan percobaan ulang cepat mengurangi gesekan dari ide hingga ekspor.

Sana video di Story321 dibuat untuk kreator yang menginginkan hasil gerakan yang cepat, dapat diprediksi, dan berkualitas tinggi.

Kenalan dengan Sana video

Sana video adalah generator video berbasis difusi efisien dari NVIDIA NVLabs untuk text-to-video (T2V) dan image-to-video (I2V), mendukung resolusi hingga 720p, 16 fps, dan durasi hingga satu menit, dengan fidelitas dan gerakan koheren yang didukung oleh penelitian (nvlabs.github.ionvlabs.github.io).

Text-to-Video (T2V)

Ubah bahasa alami menjadi gerakan yang hidup. Sana video mendukung narasi multi-gaya, transisi yang mulus, dan subjek yang konsisten, menghasilkan urutan 720p berkualitas tinggi pada 16 fps (nvlabs.github.io).

Image-to-Video (I2V)

Animasi bingkai tunggal menjadi klip dinamis. Pertahankan identitas dan komposisi sambil menambahkan gerakan realistis, gerakan kamera, dan kedalaman adegan (nvlabs.github.io).

Runtime yang efisien dan praktis

Hasilkan klip 5 detik dalam sekitar 60 detik, atau ~29 detik di RTX 5090 dengan optimasi NVFP4—cukup efisien untuk iterasi (youtube.com).

Open-source dan didukung penelitian

Dibangun di atas keluarga SANA (Linear Diffusion Transformer) dengan pengakuan ICLR 2025, ditambah kode open-source untuk eksplorasi dan ekstensi (nvlabs.github.ioresearch.nvidia.comgithub.com).

Apa yang dapat Anda buat dengan Sana video

Dari teaser merek hingga loop tutorial, Sana video mempercepat pembuatan konsep dan gerakan tingkat produksi.

Teaser peluncuran

Potong bidikan hero 5–10 detik dengan gerakan kamera yang terkontrol dan branding yang konsisten.

Penjelasan produk

Demonstrasikan fitur dengan ketukan gerakan yang mudah dibaca dan close-up yang jelas.

Momen karakter

Animasi gerakan maskot, ekspresi, dan micro-acting dari satu gambar.

B‑roll sinematik

Hasilkan transisi bergaya, bidikan pembuka, dan loop ambien.

Tren sosial

Buat prototipe klip yang kuat dan dapat diulang yang sesuai dengan kecepatan platform.

Pendidikan & cara‑cara

Tunjukkan gerakan langkah demi langkah dengan kejelasan kamera dan struktur temporal.

Membuat prompt Sana video seperti seorang profesional

Niat yang jelas dan isyarat temporal membantu Sana video memberikan gerakan dan gaya yang konsisten.

Elemen kunci dari prompt yang kuat

Subjek + arahan seni

Tentukan siapa/apa, ditambah estetika. Sebutkan sifat karakter, material, dan jangkar gaya.

Example: Robot barista keramik, kafe abad pertengahan, palet pastel, pencahayaan tepi lembut, sorotan bokeh

Aksi + kamera

Jelaskan kata kerja dan bahasa kamera untuk mengunci gerakan dan pembingkaian.

Example: Robot menuangkan latte art; bidikan medium handheld, dolly-in lembut, sedikit paralaks, depth of field dangkal

Lingkungan + suasana hati

Tentukan ruang, cahaya, dan atmosfer untuk menstabilkan tampilan di seluruh bingkai.

Example: Golden hour, cahaya kunci hangat, debu volumetrik, ubin reflektif, kedipan lampu neon

Ketukan temporal

Tambahkan langkah awal/tengah/akhir untuk memandu perkembangan dalam klip pendek.

Example: Mulai stabil; tengah menuang; akhir mengungkap pusaran, tahan 1 detik

I2V berbasis referensi

Untuk image-to-video, katakan apa yang harus dipertahankan vs. apa yang harus dianimasikan.

Example: Pertahankan wajah dan pakaian; tambahkan angin di rambut; slow push-in; senyum tipis di akhir

Tips pro

Eksplisit, jangan bertele-tele

Ungkapan pendek dan konkret mengungguli teks panjang dan puitis untuk kontrol gerakan.

Kaitkan gerakan dengan waktu

Gunakan detik (“tahan 1 detik”, “ramp selama 2 detik”) sehingga pengaturan waktu sesuai dengan panjang klip.

Ulangi dalam klip pendek

Sempurnakan dalam 3–5 detik; tingkatkan atau perpanjang setelah Sana video sesuai dengan niat Anda.

Contoh penyempurnaan prompt

Dasar

"Seekor rubah berlari di hutan"

Disempurnakan

"Seekor rubah merah berlari di sepanjang jalan berlumut; steady cam setinggi rubah; kabut pagi; berkas sinar matahari menembus pohon pinus; mulai lebar, tengah mengejar, akhir close-up — Sana video mempertahankan pembingkaian dan isyarat gerakan"

Dasar

"Sebuah mobil sport di jalan pesisir"

Disempurnakan

"Mobil sport merah vintage, bidikan pelacakan rendah, lens flare, tebing laut; roll mulus; melewati dua tikungan; berakhir di pemandangan tebing — Sana video mempertahankan kecepatan dan komposisi"

Cara menggunakan di Story321

Ikuti langkah-langkah ini untuk menghasilkan hasil yang konsisten dengan Sana video.

1

Pilih model

Pilih Sana video dari daftar model.

2

Pilih mode

Gunakan Text-to-Video untuk prompt, atau Image-to-Video untuk menganimasikan referensi.

3

Tulis prompt / atur referensi

Jelaskan subjek, gerakan, kamera, waktu; unggah gambar untuk I2V.

4

Atur durasi, resolusi, fps

Pilih hingga 60 detik, 720p, dan 16 fps untuk kualitas yang seimbang.

5

Sesuaikan kontrol

Sesuaikan kekuatan gerakan, jitter kamera, rasio aspek, dan seed untuk reproduktibilitas.

6

Hasilkan dan sempurnakan

Pratinjau, pangkas, dan ulangi dalam klip pendek; perpanjang setelah terkunci.

Tips

  • Ulangi pada panjang 3–5 detik sebelum memperpanjang hingga 30–60 detik.
  • Pertahankan nama subjek, gaya, dan istilah lensa yang konsisten di seluruh run.
  • Gunakan isyarat waktu seperti “tahan 1 detik” untuk menstabilkan ketukan.
  • Untuk identitas I2V, unggah referensi yang tajam dan diterangi secara merata.
  • Atur prompt yang menang sebagai templat untuk Sana video.

Spesifikasi seperti 720p, 16 fps, dan hingga 1 menit mencerminkan catatan penelitian publik saat ini; lihat halaman proyek untuk pembaruan ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/) • [github.com](https://github.com/NVlabs/Sana)).

FAQ

Pertanyaan yang sering diajukan

Jawaban untuk pertanyaan umum tentang pengaturan dan alur kerja Sana video.

Mulai berkreasi dengan Sana video

Buat prototipe, ulangi, dan publikasikan konten gerakan yang menarik—Sana video di Story321 memberi Anda kecepatan, koherensi, dan kualitas tingkat penelitian.

Kinerja dan spesifikasi didasarkan pada materi publik dan dapat berkembang dengan rilis baru ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/)).