Alibaba lanserer Wan 2.6: Epoken der alle kan være regissør er offisielt her

Alibaba lanserer Wan 2.6: Epoken der alle kan være regissør er offisielt her

6 min read

Den 16. desember lanserte Alibaba offisielt den nye generasjonen Tongyi Wanxiang 2.6-modellserien. Det er den første videogenereringsmodellen i Kina som støtter en rollefunksjon, med en enkelt videogenereringslengde som når ledende 15 sekunder innenlands.

Ved å integrere flere funksjoner som audiovisuell synkronisering, generering av flere opptak og lydstyrt videooppretting, beskrives Wan 2.6 av utviklerne som en av de mest omfattende videogenereringsmodellene når det gjelder global funksjonsdekning.

Denne oppdateringen er ikke bare en inkrementell forbedring av en enkelt funksjon; i stedet ble fem nye modeller lansert samtidig, inkludert tekst-til-video, bilde-til-video og tekst-til-bilde, som dekker viktige aspekter fra bilde til videogenerering. Dette betyr at Wan 2.6 kan gi omfattende støtte for både profesjonell filmproduksjon og hverdagsbildeoppretting.


01 Tre gjennombrudd: Kjernefunksjonene til Wan 2.6#

Try it

Gjennombruddet til Wan 2.6 ligger ikke bare i den økte genereringslengden, men også i dens multifunksjonelle integrasjon og profesjonelle utskriftskvalitet.

Basert på omfattende forbedringer i videokvalitet, lydeffekter og instruksjonsfølging, introduserer den nye versjonen rollefunksjoner og opptakskontrollfunksjoner, noe som gjør den til den mest fullfunksjons videogenereringsmodellen i Kina.

Sammenlignet med Wan 2.5 som ble lansert i september, har versjon 2.6 oppnådd betydelige forbedringer på tvers av flere dimensjoner. Etter allerede å ha blitt rangert som nummer én i Kina for bilde-til-videogenerering på den autoritative LMArena-benchmarken, skyver 2.6-versjonen dette forspranget enda lenger.

02 Rollespill: Vanlige folk kan spille hovedrollen i sine egne filmer#

Den mest iøynefallende funksjonen til Wan 2.6 er dens banebrytende rollefunksjon i Kina. Denne funksjonen lar gjennomsnittlige brukere levere fantastiske forestillinger i filmatisk opptak.

En bruker trenger bare å laste opp en personlig video og legge inn en tekstmelding som beskriver et scenario. Wan 2.6 kan deretter raskt håndtere oppgaver som opptaksdesign, karakterskuespill og dubbing, og generere en komplett kortfilm med sammenhengende fortelling og filmgradert kinematografi på bare noen få minutter, og hjelpe brukere med å oppfylle drømmen sin om å være en filmstjerne.

Teknisk sett har Tongyi Wanxiang integrert flere innovative teknologier i modellarkitekturen. Den utfører multimodal fellesmodellering og læring på inngangsreferansevideoen, og analyserer tidsmessige sekvensielle funksjoner som subjektsfølelser, kroppsholdning og visuelle egenskaper fra flere vinkler, samtidig som den trekker ut akustiske funksjoner som klangfarge og talehastighet.

03 Opptakskontroll: Automatisk generering av fortellinger med flere opptak#

Opptakskontrollfunksjonen til Wan 2.6 skiller den fra vanlige videogenereringsverktøy. Denne funksjonen kan transformere enkle brukermeldinger til manus med flere opptak, og produsere sammenhengende fortellende videoer som består av flere kameraopptak.

Ved å bruke semantisk forståelse på høyt nivå, kan Tongyi Wanxiang konstruere den originale inngangen til profesjonelle segmenter med flere opptak med en komplett historie og fortellende spenning. Under den sømløse byttingen av opptak opprettholder den enhetlig modellering av kjernesubjektet, sceneoppsettet og miljøatmosfæren, og sikrer høy konsistens i innhold, rytme og stemning gjennom hele videoen.

Denne funksjonen gjør det mulig for Wan 2.6 å forstå og utføre komplekse filmatiske språkinstruksjoner, og utføre arbeidet til profesjonelle fotografer og redaktører med en enkelt kommando.

04 Multi-Audio Drive: En unik global innovasjon#

Wan 2.6 er også anerkjent som en videogenereringsmodell med den mest omfattende globale funksjonaliteten. Den er kjent for å inneholde en "multi-audio drive"-funksjon, der flere lydspor kan fungere som "drivsignaler" som påvirker karakterhandlinger, munnbevegelser og opptakstempo, og går utover enkel etterproduksjonsdubbing for mer naturlig audiovisuell synkronisering.

Dette tekniske høydepunktet gjør det mulig for Wan 2.6 å oppnå mer realistiske audiovisuelle synkroniseringseffekter. Ved å utføre multimodal fellesmodellering på referansevideoen og samtidig trekke ut tidsmessige visuelle funksjoner og akustiske funksjoner, oppnår modellen full sensorisk konsistensmigrering av bilde og lyd under genereringsprosessen.

05 Praktiske bruksscenarier: Fra personlig underholdning til profesjonell skapelse#

Fremveksten av Wan 2.6 vil ytterligere senke barrieren for videooppretting og utvide bruksgrensene for AI-videogenerering.

For individuelle brukere tilbyr Wan 2.6 en svært attraktiv underholdningsopplevelse. Ved å bare laste opp en personlig video og legge inn en tekstmelding, kan brukere generere kreative kortfilmer med seg selv i hovedrollen, for eksempel sci-fi- eller spenningsklipp.

I det profesjonelle skapelsesfeltet, som reklamedesign og kortdramaproduksjon, kan Wan 2.6 generere komplette fortellende kortfilmer basert på sekvensielle meldinger.

For eksempel kan du legge inn en melding som beskriver et reklamekonsept, slik at Wan 2.6 kan produsere en kommersiell video med karakterer og produkter, og opprettholde konsistensen av nøkkelinformasjon som emnet og scenen på tvers av flere opptaksendringer.

For øyeblikket støtter Wanxiang-modellfamilien mer enn 10 forskjellige visuelle opprettingsmuligheter, inkludert tekst-til-bilde, bilderedigering, tekst-til-video, bilde-til-video og rollespill. Den er allerede mye brukt i områder som AI-tegneserier, reklamedesign og kortvideooppretting.

06 Hvordan få tilgang: Praktisk multi-plattformopplevelse#

Wan 2.6 er nå tilgjengelig på flere plattformer, og tilbyr brukerne forskjellige valg for tilgang:

  • Tongyi Wanxiang offisielle nettsted: Individuelle brukere kan direkte oppleve grunnleggende funksjoner gratis på det offisielle nettstedet.
  • Alibaba Cloud Bailian-plattform: Gir API-grensesnitt for bedrifter og utviklere for å integrere i sine egne applikasjoner.
  • story321.com-plattform: Brukere kan også bruke Wan 2.6 på denne plattformen som er fokusert på AI-historiegenerering. Den er spesielt optimalisert for å generere fortellende innhold, noe som gjør den egnet for å lage korte videohistorier, animasjoner og lignende innhold.

For profesjonelle brukere og bedrifter anbefales det å få tilgang til API-tjenestene via Alibaba Cloud Bailian-plattformen for mer stabil ytelse og støtte. For individuelle brukere og kreative entusiaster gir Wanxiang offisielle nettsted og story321.com muligheter for opplevelse uten terskel. Story321.com er et ideelt valg spesielt for brukere som ønsker å lage sammenhengende historieinnhold.


Ankomsten av Wan 2.6 betyr at AI-videogenereringsteknologi har utviklet seg fra enkel bilde-sekvensoppretting til et nytt stadium av omfattende filmatisk skapelse. Det senker ikke bare terskelen for profesjonell videoproduksjon, men gir også alle mulighet til å uttrykke sin kreativitet på en praktisk måte, og realisere visjonen om at "alle kan være regissør".

For øyeblikket er Wan 2.6 tilgjengelig på Alibaba Cloud Bailian, det offisielle nettstedet til Tongyi Wanxiang og story321.com-plattformen. Alle kan oppleve det direkte på disse plattformene, og bedriftsbrukere kan også kalle modell-API-en via Alibaba Cloud Bailian. Det rapporteres at Qianwen APP også snart vil lansere modellen, og tilby rikere måter å samhandle med den på.

S
Author

Story321 AI Blog Team is dedicated to providing in-depth, unbiased evaluations of technology products and digital solutions. Our team consists of experienced professionals passionate about sharing practical insights and helping readers make informed decisions.

Start Creating with AI

Transform your creative ideas into reality with Story321 AI tools

Get Started Free

Related Articles