Преодолевая границы 3D-генерации: углубленный взгляд на Microsoft TRELLIS.2

Преодолевая границы 3D-генерации: углубленный взгляд на Microsoft TRELLIS.2

3 min read

В области создания 3D-контента высококачественные и эффективные генеративные модели всегда были ключевой целью для исследователей. Новая модель TRELLIS.2 от Microsoft с открытым исходным кодом привносит революционный прогресс в 3D-генерацию благодаря своей инновационной технической архитектуре и исключительной производительности.

Что такое TRELLIS.2?#

TRELLIS.2 — это крупномасштабная 3D-генеративная модель с 4 миллиардами параметров, специально разработанная для высокоточной генерации 3D из изображений. Основной прорыв этой модели заключается во внедрении нового разреженного воксельного представления под названием "O-Voxel", которое коренным образом преобразует традиционный рабочий процесс 3D-генерации.

Ключевые технические особенности#

🚀 Исключительная эффективность и качество генерации#

TRELLIS.2 достигает идеального баланса между скоростью и качеством генерации:

РазрешениеОбщее времяГенерация формыГенерация материала
512³~3 секунды2 секунды1 секунда
1024³~17 секунд10 секунд7 секунд
1536³~60 секунд35 секунд25 секунд

Протестировано на NVIDIA H100 GPU

🔄 Революционное представление O-Voxel#

Традиционные представления изоповерхностей имеют ограничения при обработке сложных структур, но технология O-Voxel преодолевает эти ограничения:

  • Обработка открытых поверхностей: Превосходно обрабатывает незамкнутые структуры, такие как одежда и листья
  • Поддержка не-многосвязной геометрии: Обрабатывает сложные топологии без громоздких преобразований
  • Сохранение внутренней структуры: Полностью сохраняет детали внутренних замкнутых структур

🎨 Полная поддержка PBR-материалов#

В отличие от моделей, которые генерируют только основные цвета, TRELLIS.2 поддерживает полные Physically-Based Rendering (PBR) материалы:

  • Базовый цвет
  • Шероховатость
  • Металличность
  • Непрозрачность

⚡ Минималистичный конвейер обработки#

TRELLIS.2 оптимизирует конвейер обработки данных для почти мгновенных преобразований:

  • Текстурированная сетка → O-Voxel: <10 секунд (один CPU)
  • O-Voxel → Текстурированная сетка: <100 миллисекунд (CUDA)

Инновации технической архитектуры#

Разреженное 3D VAE кодирование#

Модель использует разреженный 3D Variational Autoencoder с 16-кратным пространственным понижением дискретизации для кодирования 3D-активов в компактное латентное пространство, закладывая основу для последующей генерации.

Архитектура генерации на основе DiT#

В ней используются стандартные Diffusion Transformers (DiT) для эффективной генерации, что демонстрирует мощный потенциал традиционных архитектур с новыми представлениями.

Перспективы применения#

Технические прорывы TRELLIS.2 открывают новые возможности для различных областей:

  1. Разработка игр: Быстрая генерация высококачественных 3D-активов
  2. Виртуальная реальность: Создание иммерсивных сред в реальном времени
  3. Промышленный дизайн: Быстрое прототипирование и визуализация
  4. Кинопроизводство: Эффективная генерация активов для спецэффектов

Экосистема открытого исходного кода#

Проект построен на нескольких высокопроизводительных специализированных библиотеках:

  • O-Voxel: Основная библиотека обработки представлений
  • FlexGEMM: Эффективная разреженная свертка на основе Triton
  • CuMesh: Утилиты обработки сеток с ускорением CUDA

Заключение#

TRELLIS.2 представляет собой важную веху в технологии 3D-генерации. Его инновационное представление O-Voxel и эффективная архитектура генерации устанавливают новые стандарты для отрасли. Благодаря полному открытию исходного кода и предварительно обученных моделей эта технология готова ускорить разработку во всей области создания 3D-контента.

Для разработчиков и исследователей сейчас самое подходящее время для изучения и использования этого мощного инструмента. Будь то коммерческие приложения или академические исследования, TRELLIS.2 открывает новую дверь в автоматизированную высококачественную генерацию 3D-контента.

Адрес проекта: https://github.com/microsoft/TRELLIS.2
Предварительно обученная модель: https://huggingface.co/microsoft/TRELLIS.2-4B

S
Author

Story321 AI Blog Team is dedicated to providing in-depth, unbiased evaluations of technology products and digital solutions. Our team consists of experienced professionals passionate about sharing practical insights and helping readers make informed decisions.

Start Creating with AI

Transform your creative ideas into reality with Story321 AI tools

Get Started Free

Related Articles