Mendobrak Batas Generasi 3D: Tinjauan Mendalam tentang TRELLIS.2 dari Microsoft

Mendobrak Batas Generasi 3D: Tinjauan Mendalam tentang TRELLIS.2 dari Microsoft

3 min read

Dalam bidang pembuatan konten 3D, model generatif berkualitas tinggi dan efisien selalu menjadi tujuan utama bagi para peneliti. Model TRELLIS.2 yang baru saja dibuka sumbernya oleh Microsoft membawa kemajuan inovatif pada generasi 3D dengan arsitektur teknisnya yang inovatif dan kinerja yang luar biasa.

Apa itu TRELLIS.2?#

TRELLIS.2 adalah model generatif 3D skala besar dengan 4 miliar parameter, yang dirancang khusus untuk generasi gambar-ke-3D dengan fidelitas tinggi. Terobosan inti dari model ini terletak pada pengenalan representasi voxel jarang baru yang disebut "O-Voxel," yang secara fundamental mengubah alur kerja generasi 3D tradisional.

Fitur Teknis Utama#

🚀 Efisiensi dan Kualitas Generasi yang Luar Biasa#

TRELLIS.2 mencapai keseimbangan sempurna antara kecepatan dan kualitas generasi:

ResolusiTotal WaktuPembuatan BentukPembuatan Material
512³~3 detik2 detik1 detik
1024³~17 detik10 detik7 detik
1536³~60 detik35 detik25 detik

Diuji pada NVIDIA H100 GPU

🔄 Representasi O-Voxel Revolusioner#

Representasi bidang iso-permukaan tradisional memiliki keterbatasan saat menangani struktur kompleks, tetapi teknologi O-Voxel menembus batasan ini:

  • Penanganan Permukaan Terbuka: Memproses struktur non-tertutup seperti pakaian dan daun dengan sempurna
  • Dukungan Geometri Non-Manifold: Menangani topologi kompleks tanpa konversi yang rumit
  • Preservasi Struktur Internal: Mempertahankan detail struktur tertutup internal sepenuhnya

🎨 Dukungan Material PBR Penuh#

Tidak seperti model yang hanya menghasilkan warna dasar, TRELLIS.2 mendukung material Physically-Based Rendering (PBR) lengkap:

  • Warna Dasar
  • Kekasaran
  • Metalik
  • Opasitas

⚡ Alur Pemrosesan Minimalis#

TRELLIS.2 mengoptimalkan alur pemrosesan data untuk konversi yang hampir instan:

  • Mesh Bertekstur → O-Voxel: <10 detik (CPU tunggal)
  • O-Voxel → Mesh Bertekstur: <100 milidetik (CUDA)

Inovasi Arsitektur Teknis#

Pengkodean VAE 3D Jarang#

Model ini menggunakan Variational Autoencoder 3D jarang dengan downsampling spasial 16× untuk menyandikan aset 3D ke dalam ruang laten yang ringkas, meletakkan dasar untuk generasi berikutnya.

Arsitektur Generasi Berbasis DiT#

Model ini menggunakan Diffusion Transformers (DiT) standar untuk generasi yang efisien, menunjukkan potensi kuat arsitektur tradisional dengan representasi baru.

Prospek Aplikasi#

Terobosan teknis TRELLIS.2 membuka kemungkinan baru untuk berbagai bidang:

  1. Pengembangan Game: Generasi cepat aset 3D berkualitas tinggi
  2. Realitas Virtual: Pembuatan lingkungan imersif secara real-time
  3. Desain Industri: Pembuatan prototipe dan visualisasi yang cepat
  4. Produksi Film: Generasi aset efek khusus yang efisien

Ekosistem Sumber Terbuka#

Proyek ini dibangun di atas beberapa pustaka khusus berperforma tinggi:

  • O-Voxel: Pustaka pemrosesan representasi inti
  • FlexGEMM: Konvolusi jarang yang efisien berdasarkan Triton
  • CuMesh: Utilitas pemrosesan mesh yang dipercepat CUDA

Kesimpulan#

TRELLIS.2 mewakili tonggak penting dalam teknologi generasi 3D. Representasi O-Voxel yang inovatif dan arsitektur generasi yang efisien menetapkan standar baru untuk industri. Dengan pembukaan sumber kode dan model pra-pelatihan yang lengkap, teknologi ini siap untuk mempercepat pengembangan di seluruh bidang pembuatan konten 3D.

Bagi pengembang dan peneliti, sekarang adalah waktu yang tepat untuk menjelajahi dan memanfaatkan alat yang ampuh ini. Baik untuk aplikasi komersial atau penelitian akademis, TRELLIS.2 membuka pintu baru untuk generasi konten 3D berkualitas tinggi otomatis.

Alamat Proyek: https://github.com/microsoft/TRELLIS.2 Model Pra-pelatihan: https://huggingface.co/microsoft/TRELLIS.2-4B

S
Author

Story321 AI Blog Team is dedicated to providing in-depth, unbiased evaluations of technology products and digital solutions. Our team consists of experienced professionals passionate about sharing practical insights and helping readers make informed decisions.

Start Creating with AI

Transform your creative ideas into reality with Story321 AI tools

Get Started Free

Related Articles