3D içerik oluşturma alanında, yüksek kaliteli ve verimli üretken modeller her zaman araştırmacılar için önemli bir hedef olmuştur. Microsoft'un yeni açık kaynaklı TRELLIS.2 modeli, yenilikçi teknik mimarisi ve olağanüstü performansıyla 3D üretimine çığır açan bir ilerleme getiriyor.
TRELLIS.2 Nedir?#
TRELLIS.2, yüksek doğruluklu görüntüden 3D üretimi için özel olarak tasarlanmış, 4 milyar parametreli büyük ölçekli bir 3D üretken modelidir. Bu modelin temel atılımı, geleneksel 3D üretim iş akışını temelden dönüştüren "O-Voxel" adlı yeni bir seyrek voksel temsilini sunmasıdır.
Temel Teknik Özellikler#
🚀 Olağanüstü Üretim Verimliliği ve Kalitesi#
TRELLIS.2, üretim hızı ve kalitesi arasında mükemmel bir denge sağlar:
| Çözünürlük | Toplam Süre | Şekil Üretimi | Materyal Üretimi |
|---|---|---|---|
| 512³ | ~3 saniye | 2 saniye | 1 saniye |
| 1024³ | ~17 saniye | 10 saniye | 7 saniye |
| 1536³ | ~60 saniye | 35 saniye | 25 saniye |
NVIDIA H100 GPU'da test edilmiştir
🔄 Devrim Niteliğindeki O-Voxel Temsili#
Geleneksel izo-yüzey alan temsilleri, karmaşık yapıları işlerken sınırlamalara sahiptir, ancak O-Voxel teknolojisi bu kısıtlamaları aşar:
- Açık Yüzey İşleme: Giysi ve yapraklar gibi kapalı olmayan yapıları mükemmel şekilde işler
- Manifold Olmayan Geometri Desteği: Hantal dönüşümler olmadan karmaşık topolojileri işler
- İç Yapı Koruma: İç kapalı yapıların ayrıntılarını tamamen korur
🎨 Tam PBR Materyal Desteği#
Sadece temel renkler üreten modellerin aksine, TRELLIS.2 eksiksiz Fiziksel Tabanlı Render (PBR) materyallerini destekler:
- Temel Renk
- Pürüzlülük
- Metaliklik
- Opaklık
⚡ Minimalist İşleme Hattı#
TRELLIS.2, neredeyse anında dönüşümler için veri işleme hattını optimize eder:
- Dokulu Mesh → O-Voxel: <10 saniye (tek CPU)
- O-Voxel → Dokulu Mesh: <100 milisaniye (CUDA)
Teknik Mimari Yenilikler#
Seyrek 3D VAE Kodlama#
Model, 3D varlıkları kompakt bir latent alana kodlamak için 16× uzamsal alt örneklemeli seyrek bir 3D Varyasyonel Otomatik Kodlayıcı kullanır ve sonraki üretim için temel oluşturur.
DiT Tabanlı Üretim Mimarisi#
Verimli üretim için standart Difüzyon Dönüştürücüleri (DiT) kullanır ve yeni temsillerle geleneksel mimarilerin güçlü potansiyelini gösterir.
Uygulama Olasılıkları#
TRELLIS.2'nin teknik atılımları, birçok alan için yeni olanaklar sunuyor:
- Oyun Geliştirme: Yüksek kaliteli 3D varlıkların hızlı üretimi
- Sanal Gerçeklik: Sürükleyici ortamların gerçek zamanlı oluşturulması
- Endüstriyel Tasarım: Hızlı prototipleme ve görselleştirme
- Film Prodüksiyonu: Özel efekt varlıklarının verimli üretimi
Açık Kaynak Ekosistemi#
Proje, birkaç yüksek performanslı özel kitaplık üzerine kurulmuştur:
- O-Voxel: Temel temsil işleme kitaplığı
- FlexGEMM: Triton tabanlı verimli seyrek evrişim
- CuMesh: CUDA hızlandırmalı mesh işleme yardımcı programları
Sonuç#
TRELLIS.2, 3D üretim teknolojisinde önemli bir kilometre taşını temsil ediyor. Yenilikçi O-Voxel temsili ve verimli üretim mimarisi, sektör için yeni standartlar belirliyor. Kodun ve önceden eğitilmiş modellerin tamamen açık kaynaklı olmasıyla, bu teknoloji tüm 3D içerik oluşturma alanında gelişimi hızlandırmaya hazırlanıyor.
Geliştiriciler ve araştırmacılar için, şimdi bu güçlü aracı keşfetmek ve kullanmak için mükemmel bir zaman. İster ticari uygulamalar ister akademik araştırma için olsun, TRELLIS.2 otomatik yüksek kaliteli 3D içerik üretimine yeni bir kapı açıyor.
Proje Adresi: https://github.com/microsoft/TRELLIS.2 Önceden Eğitilmiş Model: https://huggingface.co/microsoft/TRELLIS.2-4B



