什麼是 Hunyuan 影片?
Hunyuan 影片是騰訊於 2024 年 12 月宣佈的革命性 AI 影片產生模型。它建立在具有 130 億個參數的統一擴散轉換器 (DiT) 架構上,可從具有卓越物理準確性和時間一致性的文字描述建立高品質影片。支援高達 720p 的解析度和長達 5 秒(129 幀)的影片長度,Hunyuan 影片採用先進的流量匹配排程器,並支援透過 xDiT 進行平行推論以實現高效產生。憑藉 FP8 量化支援,它為專業影片創作提供品質和效率。
13B 參數統一擴散轉換器架構
最高 5 秒影片產生(129 幀)
高品質輸出:720p、540p 和更低解析度
卓越的物理準確性和運動動力學
具有可配置偏移的先進流量匹配排程器
透過 xDiT 框架支援平行推論
用於有效儲存記憶體的 FP8 量化
多種長寬比:16:9、9:16、1:1 等
跨幀的出色時間一致性
具有社群支援的開放原始碼模型
Hunyuan 影片的主要功能
Hunyuan 影片結合了尖端架構和實用功能,適合專業影片創作者。
統一 DiT 架構
革命性的 13B 參數擴散轉換器,可統一影片產生,並在所有幀中提供卓越的品質和一致性。
高品質影片輸出
產生高達 720p (1280×720) 的多種解析度影片,包含 129 幀,保持卓越的視覺逼真度和細節。
物理準確性
對真實世界物理學的先進理解可產生逼真的運動、自然的物體互動和可信的動力學。
流量匹配排程器
具有可配置偏移因子的最新流量匹配排程器可實現卓越的影片產生品質和控制。
多種解析度
支援各種解析度,包括 720p (1280×720)、540p (960×544) 和多種長寬比,適用於各種使用案例。
時間一致性
在所有幀中保持平滑、連貫的運動和一致的視覺元素,以製作專業品質的影片。
透過 xDiT 進行平行推論
利用統一序列平行化進行多 GPU 加速,大幅縮短高解析度影片的產生時間。
FP8 量化支援
有效儲存記憶體的 FP8 量化可節省約 10GB 的 GPU 記憶體,同時保持產生品質,以便輕鬆部署。
如何撰寫有效的 Hunyuan 影片提示
運用提示撰寫技巧,透過 Hunyuan 影片的強大功能建立令人驚豔的 AI 產生影片。
必要的提示元素
主體與動作
清楚描述主要主體和特定動作或移動。詳細說明影片中發生的事情。
運動與動力
指定運動的類型和品質、速度、方向,以及物體如何動態互動。
視覺細節
包含顏色、光線、紋理、氣氛和環境細節,以增強真實感。
相機與透視
定義相機角度、移動、拍攝類型和畫面,以進行電影控制。
風格與心情
指定影片的視覺風格、藝術處理和情感氣氛。
環境與設定
建立位置、一天中的時間、天氣狀況和上下文背景。
獲得更好結果的專業提示
強調運動和物理
Hunyuan 影片擅長物理準確性。描述自然運動、互動、重力效應和逼真的動力,以獲得最佳效果
具體說明時間安排
在 5 秒的時間範圍內指定動作的順序和步調,以實現您想要的敘事流程
使用電影攝影術語
加入專業術語,如「景深」、「動態模糊」、「追蹤鏡頭」、「荷蘭角度」,以獲得更具電影感的輸出
分層多個細節
在全面的提示中結合主體、動作、光線、相機工作和氣氛,以製作豐富而複雜的影片
良好提示與更好提示
"一隻貓走路"
"一隻蓬鬆的橘色貓優雅地走在日落時分的木柵欄上,尾巴輕輕搖曳,金色的光芒照亮它的毛皮,相機以平滑的追蹤鏡頭跟隨,淺景深,電影風格"
"水流"
"清澈的水流過光滑的河石,產生輕柔的漣漪和水花,陽光反射在水面上產生閃光,慢動作捕捉,特寫鏡頭,具有柔和環境光線的自然森林環境"
混元視頻版本歷史
追蹤騰訊混元視頻模型的演進歷程,體驗人工智慧驅動的影片生成技術的突破性進展。
騰訊首個大型文本到視頻生成模型混元視頻的開創性版本。 它基於具有 130 億參數的統一擴散轉換器架構,在生成具有卓越物理精度和時間一致性的高質量視頻方面展示了卓越的能力。 該模型支持靈活的推理配置,包括並行處理和節省記憶體的量化,使專業視頻生成更易取得。
Key Improvements:
- •革命性的130億參數統一擴散轉換器架構
- •高質量影片生成,最長可達 5 秒(129 幀)
- •多種分辨率支持:720p、540p 以及各種長寬比
- •卓越的物理精準度,呈現逼真的運動動態
- •先進的 Flow Matching 排程器,具有可配置的位移因子
- •在所有幀中都具有出色的時間一致性
- •通過 xDiT 框架支持並行推理,實現多 GPU 加速
- •FP8 量化支持,實現節省記憶體的生成 (~10GB 容量)
- •支持多種長寬比:16:9、9:16、1:1 等
- •開源發布,提供全面的文檔和範例
- •靈活的推理選項,帶有 CPU 分流,用於高分辨率生成
- •行業領先的影片質量,具有電影般的視覺逼真度
Performance:
130 億參數,最高 720p 分辨率,129 幀(5 秒),並行推理在 8 個 GPU 上實現 5.64 倍的加速
Hunyuan 影片效能指標
效能基準測試展示了 Hunyuan 影片在影片產生方面的世界領先能力。
指標 | 分數/值 | 說明 |
---|---|---|
影片品質 | 9.5/10 | 高逼真度輸出,具有卓越的視覺細節 |
運動準確性 | 9.6/10 | 卓越的物理理解和逼真的運動 |
時間一致性 | 9.7/10 | 整個影片的平滑幀到幀連貫性 |
模型參數 | 13B | 統一擴散轉換器架構 |
最大解析度 | 720p | 最高 1280×720 高畫質輸出 |
影片長度 | 5 秒 | 標準幀率下最多 129 幀 |
提示遵從度 | 9.4/10 | 準確解譯文字描述 |
指標基於 2024 年 12 月發佈的 Hunyuan 影片模型。產生時間會因解析度、長度和硬體配置而異。使用 xDiT 進行的平行推論最多可在 8 個 GPU 上將產生時間縮短 5.64 倍。
Hunyuan 影片使用案例
探索各行各業的專業人士如何利用 Hunyuan 影片進行創新的影片內容創作。
內容創作與社群媒體
快速有效地建立引人入勝的短篇影片內容,適用於 YouTube Shorts、TikTok、Instagram Reels 和其他社群平台。
行銷與廣告
產生引人入勝的產品示範、宣傳影片和廣告內容,具有專業品質和逼真的運動。
影片與影片製作
為影片和影片專案建立預先視覺化序列、概念影片、故事板和 B-roll 素材。
教育與訓練
製作教育影片、教學內容和訓練材料,以清晰的視覺演示概念和流程。
動畫與動態圖形
為創意專案產生動畫序列、動態圖形元素和動態視覺效果。
遊戲開發
為電玩遊戲建立過場動畫、宣傳預告片、角色動畫和環境影片。
產品視覺化
透過逼真的運動、光線和物理學展示產品的運作方式,以用於電子商務和示範。
建築與設計
產生建築導覽、室內設計視覺化效果和動態空間簡報。
科學視覺化
透過準確的物理學模擬,建立科學概念、流程和現象的視覺演示。
如何使用 Hunyuan 影片
開始使用 Hunyuan 影片強大的文字轉影片功能建立令人驚豔的 AI 產生影片。
撰寫您的提示
詳細描述影片場景,包括主體、動作和運動
選擇設定
選擇解析度、長寬比和產生參數
產生影片
讓 Hunyuan 影片建立您的高品質影片序列
下載與分享
儲存您的影片並與世界分享
獲得最佳結果的提示
- •專注於描述清晰、可操作的動作和逼真的物理互動
- •包含有關光線、相機角度和視覺氣氛的特定細節,以獲得電影品質
- •在 5 秒的時間範圍內保持動作連貫 - 避免過於複雜的序列
- •根據您的目標平台試用不同的解析度和長寬比
- •使用描述性運動術語,如「流動」、「漂移」、「搖曳」,以獲得自然運動
Hunyuan 影片使用先進的流量匹配排程器和統一 DiT 架構來產生具有卓越物理準確性和時間一致性的影片。
常見問題
您需要了解的關於 Hunyuan 影片的所有資訊,從功能到技術規格。
是什麼讓 Hunyuan 影片與其他 AI 影片產生器不同?
Hunyuan 影片以其 13B 參數統一擴散轉換器架構、卓越的物理準確性和先進的流量匹配排程器而脫穎而出。它支援高達 720p 的多種解析度、透過 xDiT 進行平行推論以加快產生速度,以及用於提高記憶體效率的 FP8 量化。該模型擅長時間一致性和逼真的運動動力學。
支援哪些影片解析度和長度?
Hunyuan 影片支援多種解析度,包括 720p (1280×720)、540p (960×544) 以及具有各種長寬比(16:9、9:16、1:1 等)的較低解析度。可以產生長達 5 秒(標準幀率下 129 幀)的影片,為不同的使用案例提供一定程度的靈活性。
什麼是流量匹配?為什麼它很重要?
流量匹配是一種先進的採樣排程器,它透過學習雜訊和資料分佈之間的連續路徑來產生高品質影片。 Hunyuan 影片使用流量匹配和可配置偏移因子(預設 7.0)來實現卓越的影片品質、更好的時間一致性以及比傳統擴散排程器更準確的物理模擬。
透過 xDiT 進行的平行推論如何運作?
xDiT (適用於擴散轉換器的可擴展推論引擎) 允許使用統一序列平行化在多個 GPU 上進行平行推論。在 8 個 GPU 上,它可以將 720p 影片(129 幀)的產生時間縮短多達 5.64 倍,從而使高品質影片產生對於生產工作流程來說更加高效和易於存取。
什麼是 FP8 量化?它有什麼好處?
FP8(8 位元浮點)量化將模型的記憶體佔用空間減少約 10GB,同時保持產生品質。這使得 Hunyuan 影片更易於在 GPU 記憶體有限的系統上部署,從而可以在更經濟實惠的硬體配置上產生高品質影片。
Hunyuan 影片是否為開放原始碼且適用於商業用途?
是的,Hunyuan 影片是開放原始碼,由騰訊發佈。該模型、程式碼和權重可在 GitHub 上取得。請檢閱騰訊 Hunyuan 社群授權,以了解有關商業用途、散佈和其他使用指南的特定條款。
準備好使用 Hunyuan 影片進行創作了嗎?
加入全球創作者的行列,他們使用騰訊革命性的 13B 參數影片產生模型將他們的想法變為現實。