في مجال إنشاء المحتوى ثلاثي الأبعاد، كانت النماذج التوليدية عالية الجودة والفعالة دائمًا هدفًا رئيسيًا للباحثين. نموذج TRELLIS.2 الذي أطلقته Microsoft حديثًا كمصدر مفتوح يحقق تقدمًا رائدًا في الجيل ثلاثي الأبعاد بفضل بنيته التقنية المبتكرة وأدائه الاستثنائي.
ما هو TRELLIS.2؟#
TRELLIS.2 هو نموذج توليدي ثلاثي الأبعاد واسع النطاق يحتوي على 4 مليارات معلمة، ومصمم خصيصًا لإنشاء صور ثلاثية الأبعاد عالية الدقة. يكمن الاختراق الأساسي لهذا النموذج في تقديم تمثيل فوكسل متناثر جديد يسمى "O-Voxel"، والذي يغير بشكل جذري سير عمل الجيل ثلاثي الأبعاد التقليدي.
الميزات التقنية الرئيسية#
🚀 كفاءة وجودة توليد استثنائية#
يحقق TRELLIS.2 توازنًا مثاليًا بين سرعة التوليد والجودة:
| الدقة | الوقت الإجمالي | توليد الشكل | توليد المواد |
|---|---|---|---|
| 512³ | ~3 ثواني | 2 ثانية | 1 ثانية |
| 1024³ | ~17 ثانية | 10 ثواني | 7 ثواني |
| 1536³ | ~60 ثانية | 35 ثانية | 25 ثانية |
تم الاختبار على NVIDIA H100 GPU
🔄 تمثيل O-Voxel الثوري#
تمثيلات مجال السطح المتساوي التقليدية لها قيود عند التعامل مع الهياكل المعقدة، لكن تقنية O-Voxel تكسر هذه القيود:
- معالجة الأسطح المفتوحة: يعالج تمامًا الهياكل غير المغلقة مثل الملابس والأوراق
- دعم الهندسة غير المتشعبة: يتعامل مع الطوبولوجيا المعقدة دون تحويلات مرهقة
- الحفاظ على الهيكل الداخلي: يحافظ على تفاصيل الهياكل الداخلية المغلقة بالكامل
🎨 دعم كامل لمواد PBR#
على عكس النماذج التي تولد الألوان الأساسية فقط، يدعم TRELLIS.2 مواد العرض المستندة إلى الفيزياء (PBR) الكاملة:
- اللون الأساسي
- الخشونة
- المعدن
- التعتيم
⚡ خط أنابيب معالجة بسيط#
يعمل TRELLIS.2 على تحسين خط أنابيب معالجة البيانات لتحويلات شبه فورية:
- شبكة منسوجة ← O-Voxel: <10 ثواني (وحدة معالجة مركزية واحدة)
- O-Voxel ← شبكة منسوجة: <100 مللي ثانية (CUDA)
ابتكارات البنية التقنية#
ترميز VAE ثلاثي الأبعاد متناثر#
يستخدم النموذج مشفرًا تلقائيًا متغيرًا ثلاثي الأبعاد متناثرًا مع تقليل أبعاد مكاني بمقدار 16× لترميز الأصول ثلاثية الأبعاد في مساحة كامنة مضغوطة، مما يضع الأساس للتوليد اللاحق.
بنية التوليد المستندة إلى DiT#
يستخدم محولات الانتشار القياسية (DiT) للتوليد الفعال، مما يدل على الإمكانات القوية للهياكل التقليدية مع تمثيلات جديدة.
آفاق التطبيق#
تفتح الاختراقات التقنية لـ TRELLIS.2 إمكانيات جديدة لمجالات متعددة:
- تطوير الألعاب: توليد سريع لأصول ثلاثية الأبعاد عالية الجودة
- الواقع الافتراضي: إنشاء بيئات غامرة في الوقت الفعلي
- التصميم الصناعي: النماذج الأولية السريعة والتصور
- إنتاج الأفلام: توليد فعال لأصول المؤثرات الخاصة
نظام المصادر المفتوحة#
تم بناء المشروع على العديد من المكتبات المتخصصة عالية الأداء:
- O-Voxel: مكتبة معالجة التمثيل الأساسية
- FlexGEMM: التفاف متناثر فعال يعتمد على Triton
- CuMesh: أدوات معالجة الشبكة المسرعة بواسطة CUDA
خاتمة#
يمثل TRELLIS.2 علامة فارقة مهمة في تكنولوجيا التوليد ثلاثي الأبعاد. يضع تمثيل O-Voxel المبتكر وبنية التوليد الفعالة معايير جديدة للصناعة. مع المصادر المفتوحة الكاملة للتعليمات البرمجية والنماذج المدربة مسبقًا، فإن هذه التكنولوجيا مهيأة لتسريع التطوير في جميع أنحاء مجال إنشاء المحتوى ثلاثي الأبعاد.
بالنسبة للمطورين والباحثين، الآن هو الوقت المثالي لاستكشاف هذه الأداة القوية والاستفادة منها. سواء كان ذلك للتطبيقات التجارية أو البحث الأكاديمي، يفتح TRELLIS.2 بابًا جديدًا لتوليد محتوى ثلاثي الأبعاد عالي الجودة تلقائيًا.
عنوان المشروع: https://github.com/microsoft/TRELLIS.2 النموذج المدرب مسبقًا: https://huggingface.co/microsoft/TRELLIS.2-4B



