Alibaba Lança Wan 2.6: A Era Onde Todos Podem Ser um Diretor Chega Oficialmente

Alibaba Lança Wan 2.6: A Era Onde Todos Podem Ser um Diretor Chega Oficialmente

6 min read

Em 16 de dezembro, a Alibaba lançou oficialmente a série de modelos Tongyi Wanxiang 2.6 de nova geração. É o primeiro modelo de geração de vídeo na China a suportar uma função de role-playing, com uma duração de geração de vídeo única que atinge os 15 segundos, liderando o mercado doméstico.

Integrando múltiplas funções, como sincronização audiovisual, geração multi-shot e criação de vídeo orientada por áudio, o Wan 2.6 é descrito por seus desenvolvedores como um dos modelos de geração de vídeo mais abrangentes em termos de cobertura global de recursos.

Esta atualização não é apenas uma melhoria incremental de uma única capacidade; em vez disso, cinco novos modelos foram lançados simultaneamente, incluindo texto para vídeo, imagem para vídeo e texto para imagem, cobrindo aspectos-chave da geração de imagem para vídeo. Isso significa que o Wan 2.6 pode fornecer suporte abrangente tanto para a produção de filmes profissionais quanto para a criação de imagens do dia a dia.


01 Três Avanços: As Capacidades Essenciais do Wan 2.6#

Try it

O avanço do Wan 2.6 reside não apenas no aumento da duração da geração, mas também em sua integração multifuncional e qualidade de saída de nível profissional.

Com base em melhorias abrangentes na qualidade do vídeo, efeitos sonoros e seguimento de instruções, a nova versão introduz funções de role-playing e controle de cena, tornando-o o modelo de geração de vídeo mais completo da China.

Comparado ao Wan 2.5 lançado em setembro, a versão 2.6 alcançou melhorias significativas em várias dimensões. Já classificado em primeiro lugar na China para geração de imagem para vídeo no benchmark autorizado LMArena, a versão 2.6 impulsiona ainda mais essa liderança.

02 Role-Playing: Pessoas Comuns Podem Estrelar Seus Próprios Filmes#

A característica mais chamativa do Wan 2.6 é sua capacidade pioneira de role-playing na China. Esta função permite que usuários comuns ofereçam performances estelares dentro de filmagens de nível cinematográfico.

Um usuário simplesmente precisa enviar um vídeo pessoal e inserir um prompt de texto descrevendo um cenário. O Wan 2.6 pode então lidar rapidamente com tarefas como design de cena, atuação de personagens e dublagem, gerando um curta-metragem completo com narrativa coerente e cinematografia de nível cinematográfico em apenas minutos, ajudando os usuários a realizar seu sonho de ser uma estrela de cinema.

Tecnicamente, o Tongyi Wanxiang integrou múltiplas tecnologias inovadoras na arquitetura do modelo. Ele realiza modelagem e aprendizado conjuntos multimodais no vídeo de referência de entrada, analisando características sequenciais temporais como emoção do sujeito, postura e características visuais multiângulo, enquanto também extrai características acústicas como timbre e taxa de fala.

03 Controle de Cena: Gerando Automaticamente Narrativas Multi-Shot#

A capacidade de controle de cena do Wan 2.6 o distingue das ferramentas comuns de geração de vídeo. Este recurso pode transformar prompts simples do usuário em scripts multi-shot, produzindo vídeos narrativos coerentes consistindo em múltiplas tomadas de câmera.

Utilizando compreensão semântica de alto nível, o Tongyi Wanxiang pode construir a entrada original em segmentos multi-shot profissionais com histórias completas e tensão narrativa. Durante a troca perfeita de tomadas, ele mantém a modelagem unificada do sujeito central, layout da cena e atmosfera ambiental, garantindo alta consistência no conteúdo, ritmo e humor ao longo do vídeo.

Este recurso permite que o Wan 2.6 entenda e execute instruções complexas de linguagem cinematográfica, realizando o trabalho de fotógrafos e editores profissionais com um único comando.

04 Multi-Audio Drive: Uma Inovação Global Única#

O Wan 2.6 também é reconhecido como um modelo de geração de vídeo com a funcionalidade global mais abrangente. É notável por incorporar um recurso de "multi-audio drive", onde múltiplas faixas de áudio podem atuar como "sinais de condução" influenciando as ações dos personagens, movimentos da boca e ritmo da cena, indo além da simples dublagem de pós-produção para uma sincronização audiovisual mais natural.

Este destaque técnico permite que o Wan 2.6 alcance efeitos de sincronização audiovisual mais realistas. Ao realizar modelagem conjunta multimodal no vídeo de referência e extrair simultaneamente características visuais temporais e características acústicas, o modelo alcança a migração completa da consistência sensorial de imagem e som durante o processo de geração.

05 Cenários de Aplicação Prática: Do Entretenimento Pessoal à Criação Profissional#

O surgimento do Wan 2.6 reduzirá ainda mais a barreira para a criação de vídeo e expandirá os limites de aplicação da geração de vídeo por IA.

Para usuários individuais, o Wan 2.6 oferece uma experiência de entretenimento altamente atraente. Simplesmente enviando um vídeo pessoal e inserindo um prompt de texto, os usuários podem gerar curtas-metragens criativos estrelados por eles mesmos, como clipes de ficção científica ou suspense.

No campo da criação profissional, como design de publicidade e produção de curtas, o Wan 2.6 pode gerar curtas-metragens narrativos completos com base em prompts sequenciais.

Por exemplo, inserir um prompt descrevendo um conceito de publicidade permite que o Wan 2.6 produza um vídeo comercial apresentando personagens e produtos, mantendo a consistência de informações-chave como o assunto e a cena em múltiplas mudanças de tomada.

Atualmente, a família de modelos Wanxiang suporta mais de 10 diferentes capacidades de criação visual, incluindo texto para imagem, edição de imagem, texto para vídeo, imagem para vídeo e role-playing. Já é amplamente utilizado em áreas como séries de quadrinhos de IA, design de publicidade e criação de vídeos curtos.

06 Como Acessar: Experiência Multiplataforma Conveniente#

O Wan 2.6 já está disponível em múltiplas plataformas, oferecendo aos usuários diversas opções de acesso:

  • Site Oficial do Tongyi Wanxiang: Usuários individuais podem experimentar diretamente as funções básicas gratuitamente no site oficial.
  • Plataforma Alibaba Cloud Bailian: Fornece interfaces de API para empresas e desenvolvedores integrarem em seus próprios aplicativos.
  • Plataforma story321.com: Os usuários também podem utilizar o Wan 2.6 nesta plataforma focada na geração de histórias por IA. É particularmente otimizado para gerar conteúdo narrativo, tornando-o adequado para criar histórias de vídeo curtas, animações e conteúdo semelhante.

Para usuários profissionais e empresas, o acesso aos serviços de API através da plataforma Alibaba Cloud Bailian é recomendado para um desempenho e suporte mais estáveis. Para usuários individuais e entusiastas criativos, o site oficial do Wanxiang e o story321.com oferecem oportunidades de experiência com limiar zero. O Story321.com é uma escolha ideal especialmente para usuários que desejam criar conteúdo de história coerente.


A chegada do Wan 2.6 significa que a tecnologia de geração de vídeo por IA evoluiu da simples criação de sequência de imagens para um novo estágio de criação cinematográfica abrangente. Não só diminui o limiar para a produção de vídeo profissional, mas também capacita todos a expressar sua criatividade convenientemente, realizando a visão de que "todos podem ser um diretor".

Atualmente, o Wan 2.6 está disponível no Alibaba Cloud Bailian, no site oficial do Tongyi Wanxiang e na plataforma story321.com. Todos podem experimentá-lo diretamente nessas plataformas, e os usuários corporativos também podem chamar a API do modelo através do Alibaba Cloud Bailian. É relatado que o aplicativo Qianwen também lançará o modelo em breve, oferecendo maneiras mais ricas de interagir com ele.

S
Author

Story321 AI Blog Team is dedicated to providing in-depth, unbiased evaluations of technology products and digital solutions. Our team consists of experienced professionals passionate about sharing practical insights and helping readers make informed decisions.

Start Creating with AI

Transform your creative ideas into reality with Story321 AI tools

Get Started Free

Related Articles