Alibaba Lancia Wan 2.6: L'Era In Cui Tutti Possono Essere Registi Arriva Ufficialmente

Alibaba Lancia Wan 2.6: L'Era In Cui Tutti Possono Essere Registi Arriva Ufficialmente

6 min read

Il 16 dicembre, Alibaba ha rilasciato ufficialmente la serie di modelli Tongyi Wanxiang 2.6 di nuova generazione. È il primo modello di generazione video in Cina a supportare una funzione di role-playing, con una lunghezza di generazione video singola che raggiunge i 15 secondi, leader a livello nazionale.

Integrando molteplici funzioni come la sincronizzazione audio-visiva, la generazione multi-shot e la creazione di video guidata dall'audio, Wan 2.6 è descritto dai suoi sviluppatori come uno dei modelli di generazione video più completi in termini di copertura delle funzionalità a livello globale.

Questo aggiornamento non è solo un miglioramento incrementale di una singola capacità; invece, sono stati lanciati simultaneamente cinque nuovi modelli, tra cui text-to-video, image-to-video e text-to-image, che coprono aspetti chiave dalla generazione di immagini a quella di video. Ciò significa che Wan 2.6 può fornire un supporto completo sia per la produzione cinematografica professionale che per la creazione di immagini quotidiane.


01 Tre Svolte: Le Capacità Fondamentali di Wan 2.6#

Try it

La svolta di Wan 2.6 non risiede solo nell'aumento della lunghezza della generazione, ma anche nella sua integrazione multifunzionale e nella qualità dell'output di livello professionale.

Basandosi su miglioramenti completi nella qualità video, negli effetti sonori e nel seguire le istruzioni, la nuova versione introduce funzioni di role-playing e controllo degli scatti, rendendolo il modello di generazione video più completo in Cina.

Rispetto a Wan 2.5 rilasciato a settembre, la versione 2.6 ha ottenuto miglioramenti significativi in molteplici dimensioni. Essendo già al primo posto in Cina per la generazione di image-to-video sul benchmark autorevole LMArena, la versione 2.6 spinge ancora più avanti questo vantaggio.

02 Role-Playing: La Gente Comune Può Recitare Nei Propri Film#

La caratteristica più accattivante di Wan 2.6 è la sua capacità pionieristica di role-playing in Cina. Questa funzione consente agli utenti medi di offrire prestazioni stellari all'interno di riprese di livello cinematografico.

Un utente deve semplicemente caricare un video personale e inserire un prompt di testo che descriva uno scenario. Wan 2.6 può quindi gestire rapidamente attività come la progettazione degli scatti, la recitazione dei personaggi e il doppiaggio, generando un cortometraggio completo con una narrazione coerente e una cinematografia di livello cinematografico in pochi minuti, aiutando gli utenti a realizzare il loro sogno di essere una star del cinema.

Tecnicamente, Tongyi Wanxiang ha integrato molteplici tecnologie innovative nell'architettura del modello. Esegue la modellazione e l'apprendimento congiunti multi-modali sul video di riferimento in ingresso, analizzando le caratteristiche sequenziali temporali come l'emozione del soggetto, la postura e le caratteristiche visive multi-angolo, estraendo anche caratteristiche acustiche come il timbro e la velocità del parlato.

03 Controllo degli Scatti: Generazione Automatica di Narrazioni Multi-Shot#

La capacità di controllo degli scatti di Wan 2.6 lo distingue dagli ordinari strumenti di generazione video. Questa funzione può trasformare semplici prompt dell'utente in script multi-shot, producendo video narrativi coerenti costituiti da molteplici inquadrature.

Utilizzando la comprensione semantica di alto livello, Tongyi Wanxiang può costruire l'input originale in segmenti multi-shot professionali con una trama completa e tensione narrativa. Durante il passaggio senza interruzioni degli scatti, mantiene la modellazione unificata del soggetto principale, del layout della scena e dell'atmosfera ambientale, garantendo un'elevata coerenza nel contenuto, nel ritmo e nell'umore durante tutto il video.

Questa funzione consente a Wan 2.6 di comprendere ed eseguire complesse istruzioni di linguaggio cinematografico, realizzando il lavoro di fotografi e montatori professionisti con un singolo comando.

04 Multi-Audio Drive: Un'Innovazione Globale Unica#

Wan 2.6 è anche riconosciuto come un modello di generazione video con la funzionalità globale più completa. È noto per l'incorporazione di una funzione "multi-audio drive", in cui più tracce audio possono agire come "segnali di guida" che influenzano le azioni dei personaggi, i movimenti della bocca e il ritmo degli scatti, andando oltre il semplice doppiaggio in post-produzione per una sincronizzazione audio-visiva più naturale.

Questo punto di forza tecnico consente a Wan 2.6 di ottenere effetti di sincronizzazione audio-visiva più realistici. Eseguendo la modellazione congiunta multi-modale sul video di riferimento ed estraendo simultaneamente le caratteristiche visive temporali e le caratteristiche acustiche, il modello raggiunge la migrazione completa della coerenza sensoriale di immagine e suono durante il processo di generazione.

05 Scenari di Applicazione Pratica: Dall'Intrattenimento Personale alla Creazione Professionale#

L'emergere di Wan 2.6 abbasserà ulteriormente la barriera per la creazione di video ed espanderà i confini dell'applicazione della generazione di video AI.

Per gli utenti individuali, Wan 2.6 offre un'esperienza di intrattenimento molto interessante. Semplicemente caricando un video personale e inserendo un prompt di testo, gli utenti possono generare cortometraggi creativi con se stessi come protagonisti, come clip di fantascienza o di suspense.

Nel campo della creazione professionale, come la progettazione pubblicitaria e la produzione di corti teatrali, Wan 2.6 può generare cortometraggi narrativi completi basati su prompt sequenziali.

Ad esempio, inserendo un prompt che descriva un concetto pubblicitario, Wan 2.6 può produrre un video commerciale con personaggi e prodotti, mantenendo la coerenza delle informazioni chiave come il soggetto e la scena attraverso molteplici cambi di inquadratura.

Attualmente, la famiglia di modelli Wanxiang supporta più di 10 diverse capacità di creazione visiva, tra cui text-to-image, image editing, text-to-video, image-to-video e role-playing. È già ampiamente utilizzato in aree come le serie di fumetti AI, la progettazione pubblicitaria e la creazione di brevi video.

06 Come Accedere: Esperienza Multi-Piattaforma Conveniente#

Wan 2.6 è ora disponibile su molteplici piattaforme, offrendo agli utenti diverse scelte per l'accesso:

  • Sito Ufficiale di Tongyi Wanxiang: I singoli utenti possono sperimentare direttamente le funzioni di base gratuitamente sul sito ufficiale.
  • Piattaforma Alibaba Cloud Bailian: Fornisce interfacce API per aziende e sviluppatori da integrare nelle proprie applicazioni.
  • Piattaforma story321.com: Gli utenti possono anche utilizzare Wan 2.6 su questa piattaforma focalizzata sulla generazione di storie AI. È particolarmente ottimizzato per la generazione di contenuti narrativi, rendendolo adatto alla creazione di brevi storie video, animazioni e contenuti simili.

Per utenti professionali e aziende, si consiglia di accedere ai servizi API tramite la piattaforma Alibaba Cloud Bailian per prestazioni e supporto più stabili. Per singoli utenti e appassionati di creatività, il sito ufficiale di Wanxiang e story321.com offrono opportunità di esperienza a soglia zero. Story321.com è una scelta ideale soprattutto per gli utenti che desiderano creare contenuti di storie coerenti.


L'arrivo di Wan 2.6 significa che la tecnologia di generazione video AI si è evoluta dalla semplice creazione di sequenze di immagini a una nuova fase di creazione cinematografica completa. Non solo abbassa la soglia per la produzione video professionale, ma consente anche a tutti di esprimere la propria creatività in modo conveniente, realizzando la visione che "tutti possono essere registi".

Attualmente, Wan 2.6 è disponibile su Alibaba Cloud Bailian, sul sito ufficiale di Tongyi Wanxiang e sulla piattaforma story321.com. Tutti possono sperimentarlo direttamente su queste piattaforme e gli utenti aziendali possono anche chiamare l'API del modello tramite Alibaba Cloud Bailian. È stato riferito che l'APP Qianwen lancerà presto anche il modello, offrendo modi più ricchi per interagire con esso.

S
Author

Story321 AI Blog Team is dedicated to providing in-depth, unbiased evaluations of technology products and digital solutions. Our team consists of experienced professionals passionate about sharing practical insights and helping readers make informed decisions.

Start Creating with AI

Transform your creative ideas into reality with Story321 AI tools

Get Started Free

Related Articles