Em 16 de dezembro, a Alibaba lançou oficialmente a série de modelos Tongyi Wanxiang 2.6 de nova geração. É o primeiro modelo de geração de vídeo na China a suportar uma função de role-playing, com uma duração de geração de vídeo única que atinge os 15 segundos, liderando o mercado doméstico.
Integrando múltiplas funções, como sincronização audiovisual, geração multi-shot e criação de vídeo orientada por áudio, o Wan 2.6 é descrito por seus desenvolvedores como um dos modelos de geração de vídeo mais abrangentes em termos de cobertura global de recursos.
Esta atualização não é apenas uma melhoria incremental de uma única capacidade; em vez disso, cinco novos modelos foram lançados simultaneamente, incluindo texto para vídeo, imagem para vídeo e texto para imagem, cobrindo aspectos-chave da geração de imagem para vídeo. Isso significa que o Wan 2.6 pode fornecer suporte abrangente tanto para a produção de filmes profissionais quanto para a criação de imagens do dia a dia.
01 Três Avanços: As Capacidades Essenciais do Wan 2.6#
O avanço do Wan 2.6 reside não apenas no aumento da duração da geração, mas também em sua integração multifuncional e qualidade de saída de nível profissional.
Com base em melhorias abrangentes na qualidade do vídeo, efeitos sonoros e seguimento de instruções, a nova versão introduz funções de role-playing e controle de cena, tornando-o o modelo de geração de vídeo mais completo da China.
Comparado ao Wan 2.5 lançado em setembro, a versão 2.6 alcançou melhorias significativas em várias dimensões. Já classificado em primeiro lugar na China para geração de imagem para vídeo no benchmark autorizado LMArena, a versão 2.6 impulsiona ainda mais essa liderança.
02 Role-Playing: Pessoas Comuns Podem Estrelar Seus Próprios Filmes#
A característica mais chamativa do Wan 2.6 é sua capacidade pioneira de role-playing na China. Esta função permite que usuários comuns ofereçam performances estelares dentro de filmagens de nível cinematográfico.
Um usuário simplesmente precisa enviar um vídeo pessoal e inserir um prompt de texto descrevendo um cenário. O Wan 2.6 pode então lidar rapidamente com tarefas como design de cena, atuação de personagens e dublagem, gerando um curta-metragem completo com narrativa coerente e cinematografia de nível cinematográfico em apenas minutos, ajudando os usuários a realizar seu sonho de ser uma estrela de cinema.
Tecnicamente, o Tongyi Wanxiang integrou múltiplas tecnologias inovadoras na arquitetura do modelo. Ele realiza modelagem e aprendizado conjuntos multimodais no vídeo de referência de entrada, analisando características sequenciais temporais como emoção do sujeito, postura e características visuais multiângulo, enquanto também extrai características acústicas como timbre e taxa de fala.
03 Controle de Cena: Gerando Automaticamente Narrativas Multi-Shot#
A capacidade de controle de cena do Wan 2.6 o distingue das ferramentas comuns de geração de vídeo. Este recurso pode transformar prompts simples do usuário em scripts multi-shot, produzindo vídeos narrativos coerentes consistindo em múltiplas tomadas de câmera.
Utilizando compreensão semântica de alto nível, o Tongyi Wanxiang pode construir a entrada original em segmentos multi-shot profissionais com histórias completas e tensão narrativa. Durante a troca perfeita de tomadas, ele mantém a modelagem unificada do sujeito central, layout da cena e atmosfera ambiental, garantindo alta consistência no conteúdo, ritmo e humor ao longo do vídeo.
Este recurso permite que o Wan 2.6 entenda e execute instruções complexas de linguagem cinematográfica, realizando o trabalho de fotógrafos e editores profissionais com um único comando.
04 Multi-Audio Drive: Uma Inovação Global Única#
O Wan 2.6 também é reconhecido como um modelo de geração de vídeo com a funcionalidade global mais abrangente. É notável por incorporar um recurso de "multi-audio drive", onde múltiplas faixas de áudio podem atuar como "sinais de condução" influenciando as ações dos personagens, movimentos da boca e ritmo da cena, indo além da simples dublagem de pós-produção para uma sincronização audiovisual mais natural.
Este destaque técnico permite que o Wan 2.6 alcance efeitos de sincronização audiovisual mais realistas. Ao realizar modelagem conjunta multimodal no vídeo de referência e extrair simultaneamente características visuais temporais e características acústicas, o modelo alcança a migração completa da consistência sensorial de imagem e som durante o processo de geração.
05 Cenários de Aplicação Prática: Do Entretenimento Pessoal à Criação Profissional#
O surgimento do Wan 2.6 reduzirá ainda mais a barreira para a criação de vídeo e expandirá os limites de aplicação da geração de vídeo por IA.
Para usuários individuais, o Wan 2.6 oferece uma experiência de entretenimento altamente atraente. Simplesmente enviando um vídeo pessoal e inserindo um prompt de texto, os usuários podem gerar curtas-metragens criativos estrelados por eles mesmos, como clipes de ficção científica ou suspense.
No campo da criação profissional, como design de publicidade e produção de curtas, o Wan 2.6 pode gerar curtas-metragens narrativos completos com base em prompts sequenciais.
Por exemplo, inserir um prompt descrevendo um conceito de publicidade permite que o Wan 2.6 produza um vídeo comercial apresentando personagens e produtos, mantendo a consistência de informações-chave como o assunto e a cena em múltiplas mudanças de tomada.
Atualmente, a família de modelos Wanxiang suporta mais de 10 diferentes capacidades de criação visual, incluindo texto para imagem, edição de imagem, texto para vídeo, imagem para vídeo e role-playing. Já é amplamente utilizado em áreas como séries de quadrinhos de IA, design de publicidade e criação de vídeos curtos.
06 Como Acessar: Experiência Multiplataforma Conveniente#
O Wan 2.6 já está disponível em múltiplas plataformas, oferecendo aos usuários diversas opções de acesso:
- Site Oficial do Tongyi Wanxiang: Usuários individuais podem experimentar diretamente as funções básicas gratuitamente no site oficial.
- Plataforma Alibaba Cloud Bailian: Fornece interfaces de API para empresas e desenvolvedores integrarem em seus próprios aplicativos.
- Plataforma story321.com: Os usuários também podem utilizar o Wan 2.6 nesta plataforma focada na geração de histórias por IA. É particularmente otimizado para gerar conteúdo narrativo, tornando-o adequado para criar histórias de vídeo curtas, animações e conteúdo semelhante.
Para usuários profissionais e empresas, o acesso aos serviços de API através da plataforma Alibaba Cloud Bailian é recomendado para um desempenho e suporte mais estáveis. Para usuários individuais e entusiastas criativos, o site oficial do Wanxiang e o story321.com oferecem oportunidades de experiência com limiar zero. O Story321.com é uma escolha ideal especialmente para usuários que desejam criar conteúdo de história coerente.
A chegada do Wan 2.6 significa que a tecnologia de geração de vídeo por IA evoluiu da simples criação de sequência de imagens para um novo estágio de criação cinematográfica abrangente. Não só diminui o limiar para a produção de vídeo profissional, mas também capacita todos a expressar sua criatividade convenientemente, realizando a visão de que "todos podem ser um diretor".
Atualmente, o Wan 2.6 está disponível no Alibaba Cloud Bailian, no site oficial do Tongyi Wanxiang e na plataforma story321.com. Todos podem experimentá-lo diretamente nessas plataformas, e os usuários corporativos também podem chamar a API do modelo através do Alibaba Cloud Bailian. É relatado que o aplicativo Qianwen também lançará o modelo em breve, oferecendo maneiras mais ricas de interagir com ele.



