كسر حدود الجيل ثلاثي الأبعاد: نظرة متعمقة على TRELLIS.2 من Microsoft

كسر حدود الجيل ثلاثي الأبعاد: نظرة متعمقة على TRELLIS.2 من Microsoft

3 min read

في مجال إنشاء المحتوى ثلاثي الأبعاد، كانت النماذج التوليدية عالية الجودة والفعالة دائمًا هدفًا رئيسيًا للباحثين. نموذج TRELLIS.2 الذي أطلقته Microsoft حديثًا كمصدر مفتوح يحقق تقدمًا رائدًا في الجيل ثلاثي الأبعاد بفضل بنيته التقنية المبتكرة وأدائه الاستثنائي.

ما هو TRELLIS.2؟#

TRELLIS.2 هو نموذج توليدي ثلاثي الأبعاد واسع النطاق يحتوي على 4 مليارات معلمة، ومصمم خصيصًا لإنشاء صور ثلاثية الأبعاد عالية الدقة. يكمن الاختراق الأساسي لهذا النموذج في تقديم تمثيل فوكسل متناثر جديد يسمى "O-Voxel"، والذي يغير بشكل جذري سير عمل الجيل ثلاثي الأبعاد التقليدي.

الميزات التقنية الرئيسية#

🚀 كفاءة وجودة توليد استثنائية#

يحقق TRELLIS.2 توازنًا مثاليًا بين سرعة التوليد والجودة:

الدقةالوقت الإجماليتوليد الشكلتوليد المواد
512³~3 ثواني2 ثانية1 ثانية
1024³~17 ثانية10 ثواني7 ثواني
1536³~60 ثانية35 ثانية25 ثانية

تم الاختبار على NVIDIA H100 GPU

🔄 تمثيل O-Voxel الثوري#

تمثيلات مجال السطح المتساوي التقليدية لها قيود عند التعامل مع الهياكل المعقدة، لكن تقنية O-Voxel تكسر هذه القيود:

  • معالجة الأسطح المفتوحة: يعالج تمامًا الهياكل غير المغلقة مثل الملابس والأوراق
  • دعم الهندسة غير المتشعبة: يتعامل مع الطوبولوجيا المعقدة دون تحويلات مرهقة
  • الحفاظ على الهيكل الداخلي: يحافظ على تفاصيل الهياكل الداخلية المغلقة بالكامل

🎨 دعم كامل لمواد PBR#

على عكس النماذج التي تولد الألوان الأساسية فقط، يدعم TRELLIS.2 مواد العرض المستندة إلى الفيزياء (PBR) الكاملة:

  • اللون الأساسي
  • الخشونة
  • المعدن
  • التعتيم

⚡ خط أنابيب معالجة بسيط#

يعمل TRELLIS.2 على تحسين خط أنابيب معالجة البيانات لتحويلات شبه فورية:

  • شبكة منسوجة ← O-Voxel: <10 ثواني (وحدة معالجة مركزية واحدة)
  • O-Voxel ← شبكة منسوجة: <100 مللي ثانية (CUDA)

ابتكارات البنية التقنية#

ترميز VAE ثلاثي الأبعاد متناثر#

يستخدم النموذج مشفرًا تلقائيًا متغيرًا ثلاثي الأبعاد متناثرًا مع تقليل أبعاد مكاني بمقدار 16× لترميز الأصول ثلاثية الأبعاد في مساحة كامنة مضغوطة، مما يضع الأساس للتوليد اللاحق.

بنية التوليد المستندة إلى DiT#

يستخدم محولات الانتشار القياسية (DiT) للتوليد الفعال، مما يدل على الإمكانات القوية للهياكل التقليدية مع تمثيلات جديدة.

آفاق التطبيق#

تفتح الاختراقات التقنية لـ TRELLIS.2 إمكانيات جديدة لمجالات متعددة:

  1. تطوير الألعاب: توليد سريع لأصول ثلاثية الأبعاد عالية الجودة
  2. الواقع الافتراضي: إنشاء بيئات غامرة في الوقت الفعلي
  3. التصميم الصناعي: النماذج الأولية السريعة والتصور
  4. إنتاج الأفلام: توليد فعال لأصول المؤثرات الخاصة

نظام المصادر المفتوحة#

تم بناء المشروع على العديد من المكتبات المتخصصة عالية الأداء:

  • O-Voxel: مكتبة معالجة التمثيل الأساسية
  • FlexGEMM: التفاف متناثر فعال يعتمد على Triton
  • CuMesh: أدوات معالجة الشبكة المسرعة بواسطة CUDA

خاتمة#

يمثل TRELLIS.2 علامة فارقة مهمة في تكنولوجيا التوليد ثلاثي الأبعاد. يضع تمثيل O-Voxel المبتكر وبنية التوليد الفعالة معايير جديدة للصناعة. مع المصادر المفتوحة الكاملة للتعليمات البرمجية والنماذج المدربة مسبقًا، فإن هذه التكنولوجيا مهيأة لتسريع التطوير في جميع أنحاء مجال إنشاء المحتوى ثلاثي الأبعاد.

بالنسبة للمطورين والباحثين، الآن هو الوقت المثالي لاستكشاف هذه الأداة القوية والاستفادة منها. سواء كان ذلك للتطبيقات التجارية أو البحث الأكاديمي، يفتح TRELLIS.2 بابًا جديدًا لتوليد محتوى ثلاثي الأبعاد عالي الجودة تلقائيًا.

عنوان المشروع: https://github.com/microsoft/TRELLIS.2 النموذج المدرب مسبقًا: https://huggingface.co/microsoft/TRELLIS.2-4B

S
Author

Story321 AI Blog Team is dedicated to providing in-depth, unbiased evaluations of technology products and digital solutions. Our team consists of experienced professionals passionate about sharing practical insights and helping readers make informed decisions.

Start Creating with AI

Transform your creative ideas into reality with Story321 AI tools

Get Started Free

Related Articles