Hunyuan Motion ทำให้ภาษาธรรมชาติมีชีวิตชีวาด้วยแอนิเมชัน 3 มิติที่มีโครงกระดูกความละเอียดสูง
Hunyuan Motion คือชุดโมเดลสร้างภาพเคลื่อนไหว 3 มิติสำหรับมนุษย์จากข้อความรุ่นใหม่ ที่แปลงข้อความภาษาอังกฤษธรรมดาให้เป็นการเคลื่อนไหวที่ลื่นไหล สมจริง และมีโครงกระดูกเป็นพื้นฐาน ขับเคลื่อนโดย Diffusion Transformer ที่มีพารามิเตอร์นับพันล้าน ซึ่งได้รับการฝึกฝนด้วย Flow Matching Hunyuan Motion ยกระดับการทำตามคำสั่ง รายละเอียดการเคลื่อนไหว และความราบรื่นของเวลาไปอีกขั้น โปรเจ็กต์นี้มี CLI ที่พร้อมใช้งานและแอป Gradio แบบอินเทอร์แอกทีฟสำหรับการทำซ้ำอย่างรวดเร็ว เวิร์กโฟลว์ที่ทำซ้ำได้ และความเข้ากันได้ข้ามแพลตฟอร์ม ด้วยการฝึกอบรมล่วงหน้าขนาดใหญ่ การปรับแต่งอย่างละเอียดคุณภาพสูง และการเรียนรู้เสริมแรงจากความคิดเห็นของมนุษย์ Hunyuan Motion จึงบรรลุคุณภาพและความน่าเชื่อถือระดับแนวหน้าสำหรับเกม ภาพยนตร์ VR/AR การผลิตเสมือนจริง และไปป์ไลน์มนุษย์ดิจิทัล สำรวจการใช้งานโอเพนซอร์สอย่างเป็นทางการ น้ำหนักที่ฝึกไว้ล่วงหน้า และเครื่องมือเริ่มต้นอย่างรวดเร็วได้ที่ github.com.

Hunyuan Motion คือชุดโมเดลสร้างภาพเคลื่อนไหว 3 มิติสำหรับมนุษย์จากข้อความ ที่สร้างแอนิเมชันตัวละครที่มีโครงกระดูกเป็นพื้นฐานโดยตรงจากข้อความภาษาธรรมชาติ สร้างขึ้นบน Diffusion Transformer และฝึกฝนด้วย Flow Matching Hunyuan Motion ขยายขนาดไปสู่ระดับพารามิเตอร์นับพันล้าน เพื่อปรับปรุงการทำตามคำสั่งและคุณภาพการเคลื่อนไหวอย่างมีนัยสำคัญ เมื่อเทียบกับระบบโอเพนซอร์สก่อนหน้านี้ ไปป์ไลน์การฝึกอบรมรวมถึงสามเฟส ได้แก่ การฝึกอบรมล่วงหน้าขนาดใหญ่เกี่ยวกับการเคลื่อนไหวของมนุษย์ที่หลากหลาย การปรับแต่งอย่างละเอียดเกี่ยวกับลำดับคุณภาพสูงที่คัดสรรมา และการเรียนรู้เสริมแรงด้วยความคิดเห็นของมนุษย์ เพื่อส่งมอบการเคลื่อนไหวที่ราบรื่น สมจริงทางกายภาพ ซึ่งสอดคล้องกับทิศทางที่เป็นข้อความโดยละเอียด ผลลัพธ์คือเวิร์กโฟลว์จากข้อความเป็นแอนิเมชันที่ผสานรวมเข้ากับไปป์ไลน์ 3 มิติสมัยใหม่อย่างราบรื่น โปรเจ็กต์นี้มาพร้อมกับโมเดลมาตรฐาน (≈1.0 พันล้านพารามิเตอร์) และตัวแปร Lite (≈0.46 พันล้านพารามิเตอร์) สำหรับขอบเขตประสิทธิภาพที่แตกต่างกัน พร้อมกับการสนับสนุนข้ามแพลตฟอร์ม CLI ที่เป็นมิตรกับแบทช์ และ Gradio UI ที่ใช้งานง่ายสำหรับการสำรวจแบบอินเทอร์แอกทีฟ รายละเอียดทั้งหมด การอัปเดต และคำแนะนำการใช้งานมีอยู่ในที่เก็บอย่างเป็นทางการบน [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
Diffusion Transformer พร้อม Flow Matching ปรับขนาดเป็น ~1 พันล้านพารามิเตอร์ เพื่อการทำตามคำสั่งและคุณภาพการเคลื่อนไหวที่เหนือกว่า [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0)
การฝึกอบรมสามขั้นตอน: การฝึกอบรมล่วงหน้าขนาดใหญ่ การปรับแต่งอย่างละเอียดคุณภาพสูง และ RLHF สำหรับการเคลื่อนไหวที่เป็นธรรมชาติและสอดคล้องกัน [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0)
CLI ที่พร้อมใช้งานและแอป Gradio สำหรับการอนุมานในเครื่องอย่างรวดเร็วและการแสดงภาพแบบอินเทอร์แอกทีฟ [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0)
อะไรที่ทำให้ Hunyuan Motion แตกต่าง
Hunyuan Motion ปรับขนาดแกนหลัก DiT ด้วย Flow Matching เป็น ~1.0 พันล้านพารามิเตอร์ เพิ่มการทำตามคำสั่งและคุณภาพการเคลื่อนไหว พร้อมทั้งรักษาความเสถียรในทุกเฟรม ดูคำอธิบายโมเดลอย่างเป็นทางการและภาพรวมการฝึกอบรมได้ที่ [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
การฝึกอบรมล่วงหน้าขนาดใหญ่เกี่ยวกับข้อมูลการเคลื่อนไหวมากกว่า 3,000 ชั่วโมง สร้างความรู้พื้นฐานที่กว้างขวาง การปรับแต่งอย่างละเอียดที่คัดสรรมา 400 ชั่วโมงช่วยเพิ่มรายละเอียดและความราบรื่น RL จากความคิดเห็นของมนุษย์ปรับปรุงความเป็นธรรมชาติและการยึดมั่นในข้อความ รายละเอียดมีอยู่ใน [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
เลือก HY-Motion-1.0 (~1.0 พันล้านพารามิเตอร์) สำหรับความเที่ยงตรงของการเคลื่อนไหวระดับแนวหน้า หรือ HY-Motion-1.0-Lite (~0.46B) สำหรับการปรับใช้ที่เบากว่า ที่เก็บมีน้ำหนักและคำแนะนำสำหรับการตั้งค่าอย่างรวดเร็ว [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
Hunyuan Motion ใช้ข้อความภาษาธรรมดาและส่งออกการเคลื่อนไหวที่สอดคล้องกับการกระทำ สไตล์ และจังหวะที่ต้องการ ทำให้สามารถควบคุมความคิดสร้างสรรค์ได้โดยไม่ต้องสร้างแอนิเมชันทุกท่าด้วยมือ
หรือเชื่อมต่อตัวประมาณระยะเวลาที่ใช้ LLM และโมดูลเขียนข้อความใหม่ เพื่อปรับปรุงจังหวะและความชัดเจน Hunyuan Motion แสดงแฟล็กอย่างง่ายเพื่อเปิดหรือปิดใช้งานตัวช่วยเหล่านี้ได้ตามต้องการ [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
เรียกใช้งานแบทช์จ็อบผ่าน CLI สำหรับชุดข้อความขนาดใหญ่ หรือเปิดเซิร์ฟเวอร์ Gradio ในเครื่องสำหรับการแสดงภาพแบบอินเทอร์แอกทีฟ เครื่องมือเหล่านี้ได้รับการดูแลรักษาใน repo อย่างเป็นทางการพร้อมคำแนะนำและตัวอย่างที่ชัดเจนบน [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
Hunyuan Motion ทำงานบน macOS, Windows และ Linux ช่วยให้ทีมผสมผสานแบ่งปันเวิร์กโฟลว์ได้ repo มีข้อกำหนดและสคริปต์สำหรับการตั้งค่าและการอนุมานที่สอดคล้องกัน [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
ด้วยการสร้างการเคลื่อนไหวที่มีโครงกระดูกเป็นพื้นฐาน Hunyuan Motion จึงเหมาะกับไปป์ไลน์ตัวละครที่ติดตั้งและรองรับการกำหนดเป้าหมายใหม่ การผสม และการทำความสะอาดโดยใช้ชุดเครื่องมือ DCC ที่คุ้นเคย
จากข้อความสู่แอนิเมชันโครงกระดูก
ผู้ใช้เขียนข้อความภาษาธรรมชาติที่อธิบายการกระทำ สไตล์ และจังหวะที่ต้องการ Hunyuan Motion สามารถใช้โมดูลเขียนข้อความใหม่และการประมาณระยะเวลา เพื่อชี้แจงความตั้งใจ อนุมานเวลา และกำหนดวลีที่เป็นมาตรฐานก่อนการสร้างได้ ขั้นตอนนี้จะเพิ่มการจัดแนวระหว่างคำอธิบายข้อความและผลลัพธ์การเคลื่อนไหว โดยเฉพาะอย่างยิ่งในการกระทำที่ซับซ้อนหรือหลายขั้นตอนตามที่ระบุไว้ในที่เก็บอย่างเป็นทางการบน [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
Hunyuan Motion สุ่มตัวอย่างวิถีการเคลื่อนไหวด้วย Diffusion Transformer ที่ได้รับการฝึกฝนผ่าน Flow Matching โมเดลจะส่งออกการเคลื่อนไหว 3 มิติที่มีโครงกระดูกเป็นพื้นฐานที่ราบรื่น สอดคล้องกันตามเวลา ซึ่งเป็นไปตามข้อความ สามารถดูผลลัพธ์ได้แบบอินเทอร์แอกทีฟในแอป Gradio หรือบันทึกผ่าน CLI เพื่อรวมเข้ากับไปป์ไลน์ 3 มิติของคุณ คำแนะนำการใช้งานทั้งหมดมีอยู่ใน [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
ตั้งแต่การแสดงภาพเบื้องต้นไปจนถึงแอนิเมชันขั้นสุดท้าย
ใช้ Hunyuan Motion เพื่อสร้างการวิ่ง กระโดด โจมตี แสดงอารมณ์ และการเคลื่อนที่อย่างรวดเร็ว เพื่อสร้างต้นแบบการเล่นเกมและทำซ้ำความรู้สึกของตัวละคร นักออกแบบสามารถทดสอบรูปแบบข้อความและส่งออกการเคลื่อนไหวที่มีโครงกระดูกเป็นพื้นฐานอย่างรวดเร็ว เพื่อกำหนดเป้าหมายใหม่ไปยังแท่นขุดเจาะในเกม สำหรับไลบรารีขนาดใหญ่ขึ้น CLI รองรับการอนุมานแบทช์และการตั้งชื่อเอาต์พุตที่สอดคล้องกัน repo อย่างเป็นทางการแสดงเวิร์กโฟลว์และแฟล็กที่แนะนำบน [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
ในไปป์ไลน์ภาพยนตร์ Hunyuan Motion เร่งการแสดงภาพเบื้องต้นและการบล็อก ผู้กำกับสามารถร่างความตั้งใจเป็นข้อความ ปล่อยให้ Hunyuan Motion สร้างการเคลื่อนไหวพื้นฐาน และส่งต่อให้ผู้สร้างแอนิเมชันเพื่อปรับแต่ง พฤติกรรมการทำตามคำสั่งที่ราบรื่นช่วยให้การแก้ไขกระชับและคาดการณ์ได้ในทุกช็อต
จับคู่ Hunyuan Motion กับมนุษย์ดิจิทัลเพื่อสังเคราะห์ท่าทางที่สื่อความหมาย ลูปว่าง และการกระทำที่มีสไตล์ เนื่องจาก Hunyuan Motion อิงตามข้อความ ผู้สร้างที่ไม่ใช่ด้านเทคนิคสามารถสำรวจแนวคิดการเคลื่อนไหวได้เร็วขึ้น และทำงานร่วมกับผู้กำกับด้านเทคนิคเพื่อขัดเกลาและส่งมอบ
Hunyuan Motion รองรับการสร้างการเคลื่อนไหวของฝูงชนโดยรอบ การโต้ตอบแบบมีคำแนะนำ และจังหวะการเล่าเรื่องที่ช่วยเพิ่มความดื่มด่ำอย่างรวดเร็ว เอาต์พุตที่มีโครงกระดูกเป็นพื้นฐานทำให้การกำหนดเป้าหมายใหม่ของแอนิเมชันไปยังแท่นขุดเจาะที่ปรับให้เหมาะสมกับชุดหูฟังและข้อจำกัดรันไทม์เป็นเรื่องตรงไปตรงมา
นักการศึกษาและนักวิจัยสามารถใช้ Hunyuan Motion เป็นข้อมูลอ้างอิงสำหรับแนวทาง Diffusion Transformer และ Flow Matching ในการเคลื่อนไหว โค้ดโอเพนซอร์สและ model zoo ของโปรเจ็กต์ช่วยให้การทดลองที่ทำซ้ำได้และเกณฑ์มาตรฐานการทำตามคำสั่ง [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
เมื่อสร้างไลบรารีการเคลื่อนไหวสไตล์บ้านที่สอดคล้องกัน Hunyuan Motion จะเป็นฐานที่สอดคล้องกัน ทีมสามารถระบุโทน จังหวะ และสไตล์ในข้อความ สร้างเทคที่สอดคล้องกัน และกำหนดมาตรฐานการตรวจสอบผ่านแอป Gradio ก่อนที่จะนำเข้าสู่การจัดการสินทรัพย์
ทุกสิ่งที่คุณจำเป็นต้องรู้เพื่อเริ่มสร้างด้วย Hunyuan Motion
Hunyuan Motion สร้างการเคลื่อนไหว 3 มิติของมนุษย์ที่มีโครงกระดูกเป็นพื้นฐานจากข้อความที่แจ้ง ซึ่งออกแบบมาเพื่อรวมเข้ากับไปป์ไลน์แอนิเมชัน 3 มิติทั่วไป โมเดลมุ่งเน้นไปที่ความสมจริง ความราบรื่นของเวลา และการทำตามคำสั่ง เพื่อให้การกระทำ สไตล์ และจังหวะสะท้อนถึงสิ่งที่คุณอธิบาย ดูภาพรวมโปรเจ็กต์และตัวอย่างได้ที่ [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
Hunyuan Motion ใช้กระบวนการสามขั้นตอน: การฝึกอบรมล่วงหน้าขนาดใหญ่เกี่ยวกับการเคลื่อนไหวมากกว่า 3,000 ชั่วโมง เพื่อเรียนรู้ความรู้พื้นฐานที่กว้างขวาง การปรับแต่งอย่างละเอียดเกี่ยวกับข้อมูลคุณภาพสูงที่คัดสรรมา 400 ชั่วโมง เพื่อรายละเอียดและความราบรื่น และการเรียนรู้เสริมแรงด้วยความคิดเห็นของมนุษย์ เพื่อปรับปรุงการจัดแนวคำสั่งและความเป็นธรรมชาติ สรุปทางเทคนิคและบันทึกการฝึกอบรมอยู่ใน repo อย่างเป็นทางการบน [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
ทั้งสองเป็นส่วนหนึ่งของ Hunyuan Motion HY-Motion-1.0 คือโมเดลมาตรฐานที่มีพารามิเตอร์ ~1.0B ซึ่งเพิ่มการทำตามคำสั่งและความเที่ยงตรงของการเคลื่อนไหวให้สูงสุด ในขณะที่ HY-Motion-1.0-Lite (~0.46B) ได้รับการปรับให้เหมาะสมสำหรับการปรับใช้ที่เบากว่าและผลตอบแทนที่รวดเร็วกว่า เลือกตามงบประมาณ GPU และความต้องการด้านคุณภาพการเคลื่อนไหวของคุณ คำแนะนำในการดาวน์โหลดโมเดลมีอยู่ใน [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
ติดตั้ง PyTorch และข้อกำหนดของโปรเจ็กต์ ดาวน์โหลดน้ำหนักที่ฝึกไว้ล่วงหน้าตามคำแนะนำของ repo จากนั้นเลือกอินเทอร์เฟซที่คุณต้องการ: ใช้ CLI สำหรับข้อความแบทช์ หรือเปิดแอป Gradio สำหรับ UI แบบอินเทอร์แอกทีฟ คู่มือเริ่มต้นอย่างรวดเร็วทีละขั้นตอนมีรายละเอียดอยู่ใน [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
ได้ Hunyuan Motion สามารถใช้ตัวประมาณระยะเวลาและโมดูลเขียนข้อความใหม่ เพื่อปรับปรุงจังหวะและความชัดเจน คุณสามารถเปิดหรือปิดใช้งานโมดูลเหล่านี้ผ่านแฟล็กอย่างง่าย หากไม่มี คุณสามารถปิดใช้งานอย่างชัดเจนเพื่อหลีกเลี่ยงข้อผิดพลาดในการเชื่อมต่อ ตามที่อธิบายไว้ในบันทึกการใช้งานของที่เก็บบน [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
Hunyuan Motion รองรับ macOS, Windows และ Linux สำหรับการอนุมาน คำแนะนำในการติดตั้ง รายการการพึ่งพา และเครื่องมือสำหรับทั้ง CLI และ Gradio มีอยู่ใน [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
มี โปรเจ็กต์นี้มีแอป Gradio ที่คุณสามารถรันในเครื่องสำหรับการแสดงภาพแบบอินเทอร์แอกทีฟ repo อย่างเป็นทางการยังชี้ไปยัง Hugging Face Space และไซต์อย่างเป็นทางการสำหรับการลองใช้โมเดล ค้นหาลิงก์และการตั้งค่าได้ที่ [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
เนื่องจาก Hunyuan Motion สร้างการเคลื่อนไหวที่มีโครงกระดูกเป็นพื้นฐาน จึงสามารถกำหนดเป้าหมายใหม่ไปยังแท่นขุดเจาะของคุณ ผสมกับคลิปที่มีอยู่ และส่งผ่านเครื่องมือ DCC ของคุณเพื่อขัดเกลา CLI เหมาะสำหรับแบทช์จ็อบ ในขณะที่แอป Gradio รองรับการสำรวจเชิงสร้างสรรค์และการตรวจสอบก่อนนำเข้า เรียนรู้เพิ่มเติมได้ที่ [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
เปลี่ยนข้อความเป็นแอนิเมชันโครงกระดูกที่พร้อมสำหรับการผลิตได้แล้ววันนี้ ทำตามคู่มือเริ่มต้นอย่างรวดเร็วในที่เก็บอย่างเป็นทางการ เปิดแอป Gradio เพื่อการแสดงภาพทันที และทำซ้ำอย่างรวดเร็วด้วย CLI สำหรับการสร้างการเคลื่อนไหวแบบแบทช์ ทุกสิ่งที่คุณต้องการในการปรับใช้ Hunyuan Motion ในเครื่อง รวมถึงการพึ่งพา จุดตรวจสอบ และบันทึกการใช้งาน มีอยู่ใน github.com.
สำรวจโมเดล AI เพิ่มเติมจากผู้ให้บริการรายเดียวกัน
เปลี่ยนไอเดียและรูปภาพของคุณให้เป็นชิ้นงาน 3D ที่น่าทึ่งและพร้อมสำหรับโปรดักชั่นด้วย Hunyuan 3D ที่ปฏิวัติวงการของ Tencent โดดเด่นด้วยโมเดล diffusion ขั้นสูง, การสังเคราะห์พื้นผิวระดับมืออาชีพ และการทำงานร่วมกับ workflow ได้อย่างราบรื่นสำหรับการพัฒนาเกม, การออกแบบผลิตภัณฑ์ และศิลปะดิจิทัล
Hunyuan Image 3.0 transforms your ideas into stunning, photorealistic images with unprecedented prompt adherence and intelligent reasoning. Powered by 80B parameters and 64 experts MoE architecture, it delivers exceptional semantic accuracy and visual excellence. Experience the future of AI image generation with native multimodal understanding.
Hunyuan Video transforms your text descriptions into stunning, high-quality videos with exceptional physical accuracy and temporal consistency. Powered by a 13B parameter Unified Diffusion Transformer architecture, it generates up to 5-second videos at 720p resolution with superior motion dynamics and visual fidelity. Experience the future of video creation with advanced Flow Matching schedulers and parallel inference capabilities.
แปลงข้อความและรูปภาพเป็นโมเดล 3D คุณภาพสูง ปลดปล่อยศักยภาพในการสร้างสรรค์ของคุณ
ทำให้ภาพบุคคลมีชีวิตชีวา สร้างวิดีโอหัวพูดที่แสดงออกได้จากภาพเดียวและเสียง
Hunyuan Custom คือโซลูชันการสร้างวิดีโอแบบมัลติโมเดลที่ล้ำสมัยที่สุดของ Tencent ซึ่งช่วยให้ผู้ใช้สร้างวิดีโอที่ปรับแต่งได้ตามต้องการและมีความสอดคล้องของตัวแบบโดยใช้ AI เพียงอัปโหลดรูปภาพ พิมพ์ข้อความแจ้ง หรือเพิ่มอินพุตเสียง/วิดีโอ เพื่อสร้างเนื้อหาคุณภาพระดับภาพยนตร์ได้ในไม่กี่วินาที