16 Aralık'ta Alibaba, yeni nesil Tongyi Wanxiang 2.6 model serisini resmi olarak piyasaya sürdü. Çin'de rol yapma işlevini destekleyen ilk video oluşturma modeli olup, tek bir video oluşturma uzunluğu ülke içinde 15 saniyeye ulaşıyor.
Görsel-işitsel senkronizasyon, çoklu çekim oluşturma ve ses güdümlü video oluşturma gibi birden fazla işlevi entegre eden Wan 2.6, geliştiricileri tarafından küresel özellik kapsamı açısından en kapsamlı video oluşturma modellerinden biri olarak tanımlanıyor.
Bu güncelleme, tek bir yeteneğe yapılan artımlı bir iyileştirme değil; bunun yerine, metinden videoya, görüntüden videoya ve metinden görüntüye dahil olmak üzere beş yeni model aynı anda piyasaya sürüldü ve görüntüden video oluşturmaya kadar temel unsurları kapsıyor. Bu, Wan 2.6'nın hem profesyonel film yapımına hem de günlük görüntü oluşturmaya kapsamlı destek sağlayabileceği anlamına geliyor.
01 Üç Atılım: Wan 2.6'nın Temel Yetenekleri#
Wan 2.6'nın atılımı sadece artan oluşturma uzunluğunda değil, aynı zamanda çok işlevli entegrasyonunda ve profesyonel düzeyde çıktı kalitesinde de yatıyor.
Yeni sürüm, video kalitesi, ses efektleri ve talimat takibi konularında kapsamlı iyileştirmeler üzerine inşa edilerek, rol yapma ve çekim kontrolü işlevlerini sunuyor ve bu da onu Çin'deki en eksiksiz video oluşturma modeli yapıyor.
Eylül ayında piyasaya sürülen Wan 2.5 ile karşılaştırıldığında, 2.6 sürümü birden fazla boyutta önemli geliştirmeler elde etti. Yetkili LMArena kıyaslamasında görüntüden videoya oluşturma konusunda Çin'de zaten birinci sırada yer alan 2.6 sürümü, bu liderliği daha da ileriye taşıyor.
02 Rol Yapma: Sıradan İnsanlar Kendi Filmlerinde Başrol Oynayabilir#
Wan 2.6'nın en dikkat çekici özelliği, Çin'deki öncü rol yapma yeteneğidir. Bu işlev, ortalama kullanıcıların sinematik kalitede görüntüler içinde olağanüstü performanslar sergilemesini sağlıyor.
Bir kullanıcının tek yapması gereken, kişisel bir video yüklemek ve bir senaryoyu açıklayan bir metin istemi girmek. Wan 2.6 daha sonra çekim tasarımı, karakter oyunculuğu ve dublaj gibi görevleri hızla halledebilir ve tutarlı anlatıma ve film kalitesinde sinematografiye sahip eksiksiz bir kısa film oluşturarak kullanıcıların bir film yıldızı olma hayallerini gerçekleştirmelerine yardımcı olur.
Teknik olarak, Tongyi Wanxiang, model mimarisine birden fazla yenilikçi teknolojiyi entegre etti. Konu duygusu, duruş ve çok açılı görsel özellikler gibi zamansal sıralı özellikleri analiz ederek ve aynı zamanda tını ve konuşma hızı gibi akustik özellikleri çıkararak, girdi referans videosu üzerinde çok modlu ortak modelleme ve öğrenme gerçekleştirir.
03 Çekim Kontrolü: Otomatik Olarak Çok Çekimli Anlatılar Oluşturma#
Wan 2.6'nın çekim kontrolü yeteneği, onu sıradan video oluşturma araçlarından ayırıyor. Bu özellik, basit kullanıcı istemlerini çok çekimli senaryolara dönüştürebilir ve birden fazla kamera çekiminden oluşan tutarlı anlatı videoları üretebilir.
Yüksek düzeyde anlamsal anlayışı kullanan Tongyi Wanxiang, orijinal girdiyi eksiksiz bir hikaye örgüsü ve anlatı gerilimi ile profesyonel çok çekimli bölümlere dönüştürebilir. Çekimlerin kusursuz bir şekilde değiştirilmesi sırasında, temel konu, sahne düzeni ve çevresel atmosferin birleşik modellemesini koruyarak video boyunca içerik, ritim ve ruh halindeki yüksek tutarlılığı sağlar.
Bu özellik, Wan 2.6'nın karmaşık sinematik dil talimatlarını anlamasını ve yürütmesini sağlayarak, profesyonel fotoğrafçıların ve editörlerin işini tek bir komutla gerçekleştirmesini sağlar.
04 Çoklu Ses Sürücüsü: Eşsiz Bir Küresel Yenilik#
Wan 2.6, aynı zamanda en kapsamlı küresel işlevselliğe sahip bir video oluşturma modeli olarak da kabul ediliyor. Birden fazla ses parçasının karakter eylemlerini, ağız hareketlerini ve çekim hızını etkileyen "sürüş sinyalleri" olarak hareket edebildiği bir "çoklu ses sürücüsü" özelliği içermesiyle dikkat çekiyor ve daha doğal görsel-işitsel senkronizasyon için basit post prodüksiyon dublajının ötesine geçiyor.
Bu teknik özellik, Wan 2.6'nın daha gerçekçi görsel-işitsel senkronizasyon efektleri elde etmesini sağlıyor. Referans video üzerinde çok modlu ortak modelleme gerçekleştirerek ve aynı anda zamansal görsel özellikleri ve akustik özellikleri çıkararak, model oluşturma sürecinde resim ve sesin tam duyusal tutarlılık geçişini sağlıyor.
05 Pratik Uygulama Senaryoları: Kişisel Eğlenceden Profesyonel Yaratıcılığa#
Wan 2.6'nın ortaya çıkışı, video oluşturma bariyerini daha da düşürecek ve yapay zeka video oluşturmanın uygulama sınırlarını genişletecek.
Bireysel kullanıcılar için Wan 2.6, son derece çekici bir eğlence deneyimi sunuyor. Kullanıcılar, kişisel bir video yükleyip bir metin istemi girerek, bilim kurgu veya gerilim klipleri gibi kendilerinin başrol oynadığı yaratıcı kısa filmler oluşturabilirler.
Reklam tasarımı ve kısa drama prodüksiyonu gibi profesyonel yaratıcılık alanında, Wan 2.6, sıralı istemlere dayalı olarak eksiksiz anlatı kısa filmleri oluşturabilir.
Örneğin, bir reklam konseptini açıklayan bir istem girmek, Wan 2.6'nın karakterleri ve ürünleri içeren, konu ve sahne gibi temel bilgilerin birden fazla çekim değişikliği boyunca tutarlılığını koruyan bir reklam videosu üretmesini sağlar.
Şu anda, Wanxiang model ailesi, metinden görüntüye, görüntü düzenleme, metinden videoya, görüntüden videoya ve rol yapma dahil olmak üzere 10'dan fazla farklı görsel oluşturma yeteneğini destekliyor. Yapay zeka çizgi roman serileri, reklam tasarımı ve kısa video oluşturma gibi alanlarda zaten yaygın olarak kullanılıyor.
06 Nasıl Erişilir: Kullanışlı Çoklu Platform Deneyimi#
Wan 2.6 artık birden fazla platformda mevcut ve kullanıcılara erişim için çeşitli seçenekler sunuyor:
- Tongyi Wanxiang Resmi Web Sitesi: Bireysel kullanıcılar, temel işlevleri doğrudan resmi web sitesinde ücretsiz olarak deneyimleyebilirler.
- Alibaba Cloud Bailian Platformu: İşletmelerin ve geliştiricilerin kendi uygulamalarına entegre etmeleri için API arayüzleri sağlar.
- story321.com Platformu: Kullanıcılar, yapay zeka hikaye oluşturmaya odaklanan bu platformda da Wan 2.6'yı kullanabilirler. Özellikle anlatı içeriği oluşturmak için optimize edilmiştir ve kısa video hikayeleri, animasyonlar ve benzeri içerikler oluşturmak için uygundur.
Profesyonel kullanıcılar ve işletmeler için, daha istikrarlı performans ve destek için API hizmetlerine Alibaba Cloud Bailian platformu üzerinden erişilmesi önerilir. Bireysel kullanıcılar ve yaratıcı meraklılar için Wanxiang resmi web sitesi ve story321.com, sıfır eşikli deneyim fırsatları sunuyor. Story321.com, özellikle tutarlı hikaye içeriği oluşturmak isteyen kullanıcılar için ideal bir seçimdir.
Wan 2.6'nın gelişi, yapay zeka video oluşturma teknolojisinin basit görüntü dizisi oluşturmadan kapsamlı sinematik yaratıcılığın yeni bir aşamasına evrildiğini gösteriyor. Sadece profesyonel video prodüksiyonu için eşiği düşürmekle kalmıyor, aynı zamanda herkesi yaratıcılıklarını rahatça ifade etmeleri için güçlendirerek "herkesin yönetmen olabileceği" vizyonunu gerçekleştiriyor.
Şu anda Wan 2.6, Alibaba Cloud Bailian, Tongyi Wanxiang resmi web sitesi ve story321.com platformunda mevcut. Herkes bu platformlarda doğrudan deneyimleyebilir ve kurumsal kullanıcılar da Alibaba Cloud Bailian aracılığıyla model API'sini çağırabilir. Qianwen APP'nin de yakında modeli başlatacağı ve onunla etkileşim kurmanın daha zengin yollarını sunacağı bildiriliyor.



