Bryter grensene for 3D-generering: En dyptgående titt på Microsofts TRELLIS.2

Bryter grensene for 3D-generering: En dyptgående titt på Microsofts TRELLIS.2

3 min read

Innenfor 3D-innholdsproduksjon har høykvalitets og effektive generative modeller alltid vært et sentralt mål for forskere. Microsofts nylig åpenkildekode-utgitte TRELLIS.2-modell bringer banebrytende fremskritt til 3D-generering med sin innovative tekniske arkitektur og eksepsjonelle ytelse.

Hva er TRELLIS.2?#

Try it

TRELLIS.2 er en storskala 3D-generativ modell med 4 milliarder parametere, spesielt designet for høyoppløselig bilde-til-3D-generering. Det sentrale gjennombruddet i denne modellen ligger i introduksjonen av en ny sparsom voxel-representasjon kalt "O-Voxel," som fundamentalt transformerer den tradisjonelle 3D-genereringsarbeidsflyten.

Viktige tekniske funksjoner#

🚀 Eksepsjonell genereringseffektivitet og kvalitet#

TRELLIS.2 oppnår en perfekt balanse mellom genereringshastighet og kvalitet:

OppløsningTotal tidFormgenereringMaterialgenerering
512³~3 sekunder2 sekunder1 sekund
1024³~17 sekunder10 sekunder7 sekunder
1536³~60 sekunder35 sekunder25 sekunder

Testet på NVIDIA H100 GPU

🔄 Revolusjonerende O-Voxel-representasjon#

Tradisjonelle iso-overflatefeltrepresentasjoner har begrensninger når de håndterer komplekse strukturer, men O-Voxel-teknologien bryter gjennom disse begrensningene:

  • Åpen overflatehåndtering: Prosesserer perfekt ikke-lukkede strukturer som klær og blader
  • Støtte for ikke-manifold-geometri: Håndterer komplekse topologier uten tungvinte konverteringer
  • Bevaring av intern struktur: Opprettholder detaljer i interne lukkede strukturer fullstendig

🎨 Full PBR-materialstøtte#

I motsetning til modeller som bare genererer grunnleggende farger, støtter TRELLIS.2 komplette Physically-Based Rendering (PBR)-materialer:

  • Basisfarge
  • Ruhet
  • Metallisk
  • Opasitet

⚡ Minimalistisk prosesseringspipeline#

TRELLIS.2 optimaliserer dataprosesseringspipelinen for nesten umiddelbare konverteringer:

  • Teksturert mesh → O-Voxel: <10 sekunder (enkelt CPU)
  • O-Voxel → Teksturert mesh: <100 millisekunder (CUDA)

Tekniske arkitekturinnovasjoner#

Sparsom 3D VAE-koding#

Modellen bruker en sparsom 3D Variational Autoencoder med 16× romlig nedskalering for å kode 3D-ressurser til et kompakt latent rom, og legger grunnlaget for påfølgende generering.

DiT-basert genereringsarkitektur#

Den bruker standard Diffusion Transformers (DiT) for effektiv generering, og demonstrerer det kraftige potensialet til tradisjonelle arkitekturer med nye representasjoner.

Anvendelsesmuligheter#

TRELLIS.2s tekniske gjennombrudd åpner for nye muligheter innen flere felt:

  1. Spillutvikling: Rask generering av høykvalitets 3D-ressurser
  2. Virtual Reality: Sanntidsopprettelse av oppslukende miljøer
  3. Industriell design: Rask prototyping og visualisering
  4. Filmproduksjon: Effektiv generering av spesialeffektressurser

Åpen kildekode-økosystem#

Prosjektet er bygget på flere høytytende spesialiserte biblioteker:

  • O-Voxel: Kjernebibliotek for representasjonsbehandling
  • FlexGEMM: Effektiv sparsom konvolusjon basert på Triton
  • CuMesh: CUDA-akselererte mesh-behandlingsverktøy

Konklusjon#

TRELLIS.2 representerer en betydelig milepæl innen 3D-genereringsteknologi. Dens innovative O-Voxel-representasjon og effektive genereringsarkitektur setter nye standarder for industrien. Med fullstendig åpen kildekode for kode og forhåndstrente modeller, er denne teknologien klar til å akselerere utviklingen på tvers av hele 3D-innholdsproduksjonsfeltet.

For utviklere og forskere er nå det perfekte tidspunktet for å utforske og utnytte dette kraftige verktøyet. Enten det er for kommersielle applikasjoner eller akademisk forskning, åpner TRELLIS.2 en ny dør til automatisert høykvalitets 3D-innholdsgenerering.

Prosjektadresse: https://github.com/microsoft/TRELLIS.2
Forhåndstrent modell: https://huggingface.co/microsoft/TRELLIS.2-4B

S
Author

Story321 AI Blog Team is dedicated to providing in-depth, unbiased evaluations of technology products and digital solutions. Our team consists of experienced professionals passionate about sharing practical insights and helping readers make informed decisions.

Try Trellis 2

Transform your creative ideas into reality with Story321 AI tools

Try Trellis 2

Related Articles