突破 3D 生成的極限:深入了解微軟的 TRELLIS.2

突破 3D 生成的極限:深入了解微軟的 TRELLIS.2

2 min read

在 3D 內容創作領域,高品質且高效率的生成模型一直是研究人員的主要目標。微軟新近開源的 TRELLIS.2 模型,以其創新的技術架構和卓越的性能,為 3D 生成帶來了突破性的進展。

什麼是 TRELLIS.2?#

TRELLIS.2 是一個具有 40 億參數的大型 3D 生成模型,專為高保真圖像到 3D 的生成而設計。該模型的核心突破在於引入了一種名為 "O-Voxel" 的新型稀疏體素表示,從根本上改變了傳統的 3D 生成工作流程。

主要技術特點#

🚀 卓越的生成效率和品質#

TRELLIS.2 在生成速度和品質之間取得了完美的平衡:

解析度總時間形狀生成材質生成
512³~3 秒2 秒1 秒
1024³~17 秒10 秒7 秒
1536³~60 秒35 秒25 秒

在 NVIDIA H100 GPU 上測試

🔄 革命性的 O-Voxel 表示#

傳統的等值面場表示在處理複雜結構時存在局限性,但 O-Voxel 技術突破了這些限制:

  • 開放表面處理:完美處理非封閉結構,如服裝和樹葉
  • 非流形幾何支援:處理複雜的拓撲結構,無需繁瑣的轉換
  • 內部結構保留:完整保留內部封閉結構的細節

🎨 完整的 PBR 材質支援#

與僅生成基本顏色的模型不同,TRELLIS.2 支援完整的基於物理的渲染 (PBR) 材質:

  • 基礎顏色
  • 粗糙度
  • 金屬度
  • 不透明度

⚡ 極簡的處理流程#

TRELLIS.2 優化了資料處理流程,實現近乎即時的轉換:

  • 紋理網格 → O-Voxel:<10 秒(單個 CPU)
  • O-Voxel → 紋理網格:<100 毫秒 (CUDA)

技術架構創新#

稀疏 3D VAE 編碼#

該模型使用具有 16 倍空間下採樣的稀疏 3D 變分自動編碼器,將 3D 資產編碼為緊湊的潛在空間,為後續生成奠定基礎。

基於 DiT 的生成架構#

它採用標準的擴散轉換器 (DiT) 進行高效生成,展示了傳統架構在新表示形式下的強大潛力。

應用前景#

TRELLIS.2 的技術突破為多個領域開闢了新的可能性:

  1. 遊戲開發:快速生成高品質的 3D 資產
  2. 虛擬實境:即時創建沉浸式環境
  3. 工業設計:快速原型設計和視覺化
  4. 電影製作:高效生成特效資產

開源生態系統#

該專案建立在幾個高性能的專用庫之上:

  • O-Voxel:核心表示處理庫
  • FlexGEMM:基於 Triton 的高效稀疏卷積
  • CuMesh:CUDA 加速的網格處理工具

結論#

TRELLIS.2 代表了 3D 生成技術的一個重要里程碑。其創新的 O-Voxel 表示和高效的生成架構為行業設定了新的標準。隨著程式碼和預訓練模型的完全開源,這項技術有望加速整個 3D 內容創作領域的發展。

對於開發人員和研究人員來說,現在是探索和利用這個強大工具的絕佳時機。無論是用於商業應用還是學術研究,TRELLIS.2 都為自動化的高品質 3D 內容生成打開了一扇新的大門。

專案地址:https://github.com/microsoft/TRELLIS.2
預訓練模型:https://huggingface.co/microsoft/TRELLIS.2-4B

S
Author

Story321 AI Blog Team is dedicated to providing in-depth, unbiased evaluations of technology products and digital solutions. Our team consists of experienced professionals passionate about sharing practical insights and helping readers make informed decisions.

Start Creating with AI

Transform your creative ideas into reality with Story321 AI tools

Get Started Free

Related Articles