Efficient Text-to-Video and Image-to-Video by NVIDIA NVLabs
يجلب فيديو Sana إنشاء نص إلى فيديو وصورة إلى فيديو فعال وعالي الجودة إلى متصفحك. أنشئ مقاطع متماسكة بدقة 720 بكسل و16 إطارًا في الثانية تصل إلى دقيقة واحدة مع أداء مدعوم بالبحث. جرب فيديو Sana على Story321 وشحن محتوى حركة مصقول بسرعة.

فيديو Sana هو مُولِّد فيديو فعال يعتمد على الانتشار من NVIDIA NVLabs لتحويل النص إلى فيديو (T2V) والصورة إلى فيديو (I2V)، يدعم دقة تصل إلى 720p، و16 إطارًا في الثانية، ومدد تصل إلى دقيقة واحدة، مع دقة مدعومة بالبحث وحركة متماسكة ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/) • [nvlabs.github.io](https://nvlabs.github.io/Sana/)).
حوّل اللغة الطبيعية إلى حركة نابضة بالحياة. يدعم فيديو Sana روايات متعددة الأنماط، وانتقالات سلسة، ومواضيع متناسقة، وينتج تسلسلات عالية الجودة بدقة 720p بمعدل 16 إطارًا في الثانية ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/)).
حوّل إطارًا واحدًا إلى مقطع ديناميكي. حافظ على الهوية والتكوين مع إضافة حركة واقعية، وحركات الكاميرا، وعمق المشهد ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/)).
أنشئ مقطعًا مدته 5 ثوانٍ في حوالي 60 ثانية، أو ~29 ثانية على RTX 5090 مع تحسينات NVFP4—فعال بما يكفي لحلقات التكرار ([youtube.com](https://www.youtube.com/watch?v=JmHxYDpCVX8)).
مبني على عائلة SANA (محول الانتشار الخطي) مع تقدير ICLR 2025، بالإضافة إلى كود مفتوح المصدر للاستكشاف والتوسعات ([nvlabs.github.io](https://nvlabs.github.io/Sana/) • [research.nvidia.com](https://research.nvidia.com/labs/eai/publication/sana/) • [github.com](https://github.com/NVlabs/Sana)).
اتبع هذه الخطوات لإنتاج نتائج متناسقة مع فيديو Sana.
اختر فيديو Sana من قائمة النماذج.
استخدم نص إلى فيديو للمطالبات، أو صورة إلى فيديو لتحريك مرجع.
صف الموضوع والحركة والكاميرا والوقت؛ قم بتحميل صورة لـ I2V.
اختر ما يصل إلى 60 ثانية و720 بكسل و16 إطارًا في الثانية للحصول على جودة متوازنة.
اضبط قوة الحركة، واهتزاز الكاميرا، ونسبة العرض إلى الارتفاع، والبذور لإمكانية التكاثر.
قم بمعاينة المقاطع القصيرة وقصها وتكرارها؛ قم بتمديدها بمجرد قفلها.
تعكس المواصفات مثل 720 بكسل و16 إطارًا في الثانية وما يصل إلى دقيقة واحدة ملاحظات البحث العامة الحالية؛ راجع صفحات المشروع للحصول على التحديثات ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/) • [github.com](https://github.com/NVlabs/Sana)).
من الإعلانات التشويقية للعلامات التجارية إلى حلقات الدروس التعليمية، يسرع فيديو Sana من وضع المفاهيم والحركة بجودة الإنتاج.
اقطع لقطات بطل مدتها 5-10 ثوانٍ مع حركات كاميرا مُحكمة وعلامة تجارية متناسقة.
أظهر الميزات بإيقاعات حركة قابلة للقراءة ولقطات قريبة واضحة.
حرّك إيماءات التميمة وتعبيراتها وتمثيلها الدقيق من صورة واحدة.
أنشئ انتقالات منمقة، ولقطات تأسيسية، وحلقات محيطة.
صمم نماذج أولية لمقاطع قوية وقابلة للتكرار تتناسب مع وتيرة النظام الأساسي.
أظهر الحركة خطوة بخطوة بوضوح الكاميرا وهيكل زمني.
إجابات على أسئلة الإعداد وسير العمل الشائعة لفيديو Sana.
دقة تصل إلى 720 بكسل، و16 إطارًا في الثانية، ومدة دقيقة واحدة لكل مقطع، وفقًا للمستندات العامة ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/)).
حوالي 60 ثانية لمقطع مدته 5 ثوانٍ، أو ~29 ثانية على RTX 5090 مع تحسينات NVFP4 ([youtube.com](https://www.youtube.com/watch?v=JmHxYDpCVX8)).
تتوفر موارد التعليمات البرمجية والبحث للاستكشاف ([github.com](https://github.com/NVlabs/Sana) • [research.nvidia.com](https://research.nvidia.com/labs/eai/publication/sana/)).
ينشئ T2V حركة من النص؛ يقوم I2V بتحريك صورة مقدمة مع الحفاظ على الهوية والتخطيط.
نعم - استخدم مصطلحات العدسة ونوع اللقطة والحركة (على سبيل المثال، “لقطة تتبع منخفضة”، “تحريك كاميرا لطيف”) في المطالبة.
راجع ترخيص المستودع وأي شروط خاصة بطرف ثالث قبل الاستخدام التجاري ([github.com](https://github.com/NVlabs/Sana)).
صمم نماذج أولية وكرر وانشر محتوى حركة مقنعًا—يمنحك فيديو Sana على Story321 السرعة والتماسك والجودة المدعومة بالبحث.
تعتمد الأداء والمواصفات على المواد العامة وقد تتطور مع الإصدارات الجديدة ([nvlabs.github.io](https://nvlabs.github.io/Sana/Video/)).