Pada tanggal 16 Desember, Alibaba secara resmi merilis seri model Tongyi Wanxiang 2.6 generasi baru. Ini adalah model pembuatan video pertama di Tiongkok yang mendukung fungsi bermain peran (role-playing), dengan durasi pembuatan video tunggal mencapai 15 detik, yang terdepan di dalam negeri.
Mengintegrasikan berbagai fungsi seperti sinkronisasi audio-visual, pembuatan multi-shot, dan pembuatan video berbasis audio, Wan 2.6 digambarkan oleh pengembangnya sebagai salah satu model pembuatan video terlengkap dalam hal cakupan fitur global.
Pembaruan ini bukan hanya peningkatan bertahap pada satu kemampuan; melainkan, lima model baru diluncurkan secara bersamaan, termasuk text-to-video, image-to-video, dan text-to-image, yang mencakup aspek-aspek penting dari pembuatan gambar hingga video. Ini berarti Wan 2.6 dapat memberikan dukungan komprehensif untuk produksi film profesional dan pembuatan gambar sehari-hari.
01 Tiga Terobosan: Kemampuan Inti Wan 2.6#
Terobosan Wan 2.6 tidak hanya terletak pada peningkatan durasi pembuatan, tetapi juga pada integrasi multi-fungsi dan kualitas output tingkat profesional.
Membangun peningkatan komprehensif dalam kualitas video, efek suara, dan pemahaman instruksi, versi baru ini memperkenalkan fungsi bermain peran dan kontrol shot, menjadikannya model pembuatan video paling lengkap di Tiongkok.
Dibandingkan dengan Wan 2.5 yang dirilis pada bulan September, versi 2.6 telah mencapai peningkatan signifikan di berbagai dimensi. Setelah menduduki peringkat pertama di Tiongkok untuk pembuatan image-to-video pada tolok ukur LMArena yang otoritatif, versi 2.6 semakin memperkuat keunggulan ini.
02 Bermain Peran: Orang Biasa Bisa Jadi Bintang di Film Mereka Sendiri#
Fitur Wan 2.6 yang paling menarik perhatian adalah kemampuan bermain peran (role-playing) perintisnya di Tiongkok. Fungsi ini memungkinkan pengguna biasa untuk memberikan penampilan yang luar biasa dalam rekaman berkualitas sinematik.
Pengguna hanya perlu mengunggah video pribadi dan memasukkan prompt teks yang menggambarkan sebuah skenario. Wan 2.6 kemudian dapat dengan cepat menangani tugas-tugas seperti desain shot, akting karakter, dan dubbing, menghasilkan film pendek lengkap dengan narasi yang koheren dan sinematografi tingkat film hanya dalam hitungan menit, membantu pengguna mewujudkan impian mereka untuk menjadi bintang film.
Secara teknis, Tongyi Wanxiang telah mengintegrasikan berbagai teknologi inovatif ke dalam arsitektur model. Ia melakukan pemodelan dan pembelajaran gabungan multi-modal pada video referensi input, menganalisis fitur-fitur temporal berurutan seperti emosi subjek, postur, dan karakteristik visual multi-sudut, sambil juga mengekstraksi fitur akustik seperti timbre dan kecepatan bicara.
03 Kontrol Shot: Secara Otomatis Menghasilkan Narasi Multi-Shot#
Kemampuan kontrol shot Wan 2.6 membedakannya dari alat pembuatan video biasa. Fitur ini dapat mengubah prompt pengguna sederhana menjadi skrip multi-shot, menghasilkan video naratif koheren yang terdiri dari beberapa shot kamera.
Dengan memanfaatkan pemahaman semantik tingkat tinggi, Tongyi Wanxiang dapat membangun input asli menjadi segmen multi-shot profesional dengan alur cerita dan ketegangan naratif yang lengkap. Selama peralihan shot yang mulus, ia mempertahankan pemodelan terpadu dari subjek inti, tata letak adegan, dan suasana lingkungan, memastikan konsistensi tinggi dalam konten, ritme, dan suasana hati di seluruh video.
Fitur ini memungkinkan Wan 2.6 untuk memahami dan menjalankan instruksi bahasa sinematik yang kompleks, menyelesaikan pekerjaan fotografer dan editor profesional hanya dengan satu perintah.
04 Multi-Audio Drive: Inovasi Global yang Unik#
Wan 2.6 juga diakui sebagai model pembuatan video dengan fungsionalitas global terlengkap. Ia terkenal karena menggabungkan fitur "multi-audio drive", di mana beberapa track audio dapat bertindak sebagai "sinyal penggerak" yang memengaruhi tindakan karakter, gerakan mulut, dan pengaturan tempo shot, melampaui dubbing pasca-produksi sederhana untuk sinkronisasi audio-visual yang lebih alami.
Sorotan teknis ini memungkinkan Wan 2.6 untuk mencapai efek sinkronisasi audio-visual yang lebih realistis. Dengan melakukan pemodelan gabungan multi-modal pada video referensi dan secara bersamaan mengekstraksi fitur visual temporal dan fitur akustik, model ini mencapai migrasi konsistensi sensorik penuh dari gambar dan suara selama proses pembuatan.
05 Skenario Aplikasi Praktis: Dari Hiburan Pribadi hingga Kreasi Profesional#
Kemunculan Wan 2.6 akan semakin menurunkan hambatan untuk pembuatan video dan memperluas batasan aplikasi pembuatan video AI.
Untuk pengguna individu, Wan 2.6 menawarkan pengalaman hiburan yang sangat menarik. Hanya dengan mengunggah video pribadi dan memasukkan prompt teks, pengguna dapat menghasilkan film pendek kreatif yang dibintangi oleh diri mereka sendiri, seperti klip fiksi ilmiah atau suspense.
Di bidang kreasi profesional, seperti desain periklanan dan produksi drama pendek, Wan 2.6 dapat menghasilkan film pendek naratif lengkap berdasarkan prompt berurutan.
Misalnya, memasukkan prompt yang menggambarkan konsep iklan memungkinkan Wan 2.6 untuk menghasilkan video komersial yang menampilkan karakter dan produk, menjaga konsistensi informasi penting seperti subjek dan adegan di berbagai perubahan shot.
Saat ini, keluarga model Wanxiang mendukung lebih dari 10 kemampuan pembuatan visual yang berbeda, termasuk text-to-image, pengeditan gambar, text-to-video, image-to-video, dan bermain peran (role-playing). Ia sudah banyak digunakan di bidang-bidang seperti seri komik AI, desain periklanan, dan pembuatan video pendek.
06 Cara Mengakses: Pengalaman Multi-Platform yang Nyaman#
Wan 2.6 sekarang tersedia di berbagai platform, menawarkan pengguna beragam pilihan untuk akses:
- Situs Web Resmi Tongyi Wanxiang: Pengguna individu dapat langsung merasakan fungsi dasar secara gratis di situs web resmi.
- Platform Alibaba Cloud Bailian: Menyediakan antarmuka API untuk perusahaan dan pengembang untuk diintegrasikan ke dalam aplikasi mereka sendiri.
- Platform story321.com: Pengguna juga dapat memanfaatkan Wan 2.6 di platform ini yang berfokus pada pembuatan cerita AI. Ini sangat dioptimalkan untuk menghasilkan konten naratif, sehingga cocok untuk membuat cerita video pendek, animasi, dan konten serupa.
Untuk pengguna profesional dan perusahaan, mengakses layanan API melalui platform Alibaba Cloud Bailian direkomendasikan untuk kinerja dan dukungan yang lebih stabil. Untuk pengguna individu dan penggemar kreatif, situs web resmi Wanxiang dan story321.com menyediakan peluang tanpa ambang batas untuk pengalaman. Story321.com adalah pilihan ideal terutama bagi pengguna yang ingin membuat konten cerita yang koheren.
Kedatangan Wan 2.6 menandakan bahwa teknologi pembuatan video AI telah berevolusi dari pembuatan urutan gambar sederhana ke tahap baru pembuatan sinematik komprehensif. Ini tidak hanya menurunkan ambang batas untuk produksi video profesional tetapi juga memberdayakan semua orang untuk mengekspresikan kreativitas mereka dengan nyaman, mewujudkan visi bahwa "setiap orang bisa menjadi sutradara".
Saat ini, Wan 2.6 tersedia di Alibaba Cloud Bailian, situs web resmi Tongyi Wanxiang, dan platform story321.com. Semua orang dapat langsung mengalaminya di platform ini, dan pengguna perusahaan juga dapat memanggil API model melalui Alibaba Cloud Bailian. Dilaporkan bahwa APP Qianwen juga akan segera meluncurkan model ini, menawarkan cara yang lebih kaya untuk berinteraksi dengannya.



