I

IndexTTS

IndexTTS هو نظام تحويل النص إلى كلام صناعي من Bilibili يقدم تركيبًا صوتيًا عالي الجودة مع استنساخ صوتي فوري ودعم متعدد اللغات وقدرات التحكم في المشاعر.

Index TTS 2.0 Voice Generation

Generate natural and clear speech using reference audio and text

app.audioapp.click-upload

app.audioapp.audio-file-requirements

0 / 2000 characters

Credits Needed: 0

Pricing based on estimated audio duration, differentiated for CJK and Latin languages

No audio generated yet

Upload reference audio and enter text to generate

الميزات الرئيسية لـ IndexTTS

IndexTTS هو نظام تحويل النص إلى كلام صناعي تم تطويره بواسطة Bilibili، ويوفر استنساخًا صوتيًا فوريًا ودعمًا متعدد اللغات وقدرات التحكم في المشاعر.

استنساخ صوتي فوري

استنساخ خصائص صوت أي متحدث باستخدام مقطع صوتي مرجعي قصير فقط دون تدريب إضافي

تصحيح النطق

نظام تصحيح متقدم يعتمد على نظام بينيين يتعامل مع الأحرف متعددة الأصوات والكلمات النادرة والفروق الدقيقة في النطق بشكل مثالي

دعم متعدد اللغات

تركيب الكلام بسلاسة بلغات متعددة بما في ذلك الصينية والإنجليزية مع تبديل طبيعي للغة

التحكم في المشاعر

التحكم في النغمات العاطفية في الكلام المركب لإنشاء صوت أكثر تعبيرًا وطبيعية

صوت عالي الجودة

يضمن برنامج BigVGAN2 المدمج جودة صوت فائقة مع تشابه عالٍ للمتحدث (MOS: 4.01)

التحكم في الإيقاف المؤقت

التحكم بدقة في إيقاع الكلام والتوقفات المؤقتة من خلال علامات الترقيم لتقديم طبيعي

حالات الاستخدام الشائعة

اكتشف كيف يمكن لـ IndexTTS تحويل سير عمل إنشاء المحتوى الصوتي الخاص بك

إنشاء المحتوى

إنشاء تعليقات صوتية طبيعية لمقاطع الفيديو والبودكاست والمحتوى التعليمي دون معدات تسجيل

إنتاج الكتب الصوتية

تحويل الكتب والمقالات إلى كتب صوتية جذابة بجودة صوت متسقة وتعبير عاطفي

تعلم اللغة

إنشاء أمثلة للنطق ومواد استماع لتعليم اللغة بجودة شبيهة بالمتحدثين الأصليين

إمكانية الوصول

اجعل المحتوى المكتوب في متناول الجميع من خلال تحويل النص إلى كلام عالي الجودة للمستخدمين ضعاف البصر

استنساخ الصوت

الحفاظ على الأصوات واستنساخها لمساعدين شخصيين يعملون بالذكاء الاصطناعي أو شخصيات افتراضية أو أغراض تذكارية

وسائط متعددة اللغات

إنشاء محتوى متعدد اللغات بأصوات طبيعية بلغات مختلفة للجماهير العالمية

دليل إدخال النص لـ IndexTTS

تعلم كيفية صياغة مدخلات نصية فعالة للحصول على نتائج مثالية لتركيب الصوت

العناصر الأساسية

هيكل نصي واضح

استخدم علامات الترقيم المناسبة للتحكم في التوقفات والإيقاع في الكلام الذي تم إنشاؤه

Example: مرحبًا، بكم في IndexTTS. اليوم، سوف نستكشف تقنية استنساخ الصوت.

تلميحات النطق

بالنسبة للنص الصيني، استخدم تدوين بينيين لتصحيح الأحرف متعددة الأصوات

Example: 重[chóng]要的事情说三[sān]遍 (الأشياء المهمة تقال ثلاث مرات)

علامات المشاعر

حدد النغمات العاطفية لجعل الكلام أكثر تعبيرًا وطبيعية

Example: [سعيد] أنا متحمس جدًا لمشاركة هذه الأخبار معك!

خلط اللغات

امزج بسلاسة بين الصينية والإنجليزية في إدخال النص الخاص بك

Example: أنا اليوم تعلمت machine learning 和 deep learning 的基础知识 (تعلمت اليوم أساسيات تعلم الآلة والتعلم العميق)

نصائح احترافية للحصول على نتائج أفضل

استخدم علامات الترقيم الطبيعية

أضف الفواصل والنقاط وعلامات التعجب بشكل طبيعي للتحكم في إيقاع الكلام والتوقفات المؤقتة

صوت مرجعي عالي الجودة

لاستنساخ الصوت، استخدم صوتًا مرجعيًا واضحًا مع الحد الأدنى من الضوضاء في الخلفية (5-10 ثوانٍ هي الأمثل)

قسّم النصوص الطويلة

قسّم النصوص الطويلة جدًا إلى أجزاء أصغر للحصول على جودة أكثر اتساقًا ومعالجة أسهل

اختبر النطق

بالنسبة للنص الصيني الذي يحتوي على أحرف نادرة، اختبر النطق وأضف تصحيحات بينيين إذا لزم الأمر

إدخال أساسي مقابل إدخال مُحسَّن

إدخال أساسي

"今天天气很好 (الطقس جميل اليوم)"

إدخال مُحسَّن

"今天天气很好,让我们出去走走吧!(الطقس جميل اليوم، دعنا نخرج ونتنزه!)"

إدخال أساسي

"I have great news to share (لدي أخبار رائعة لمشاركتها)"

إدخال مُحسَّن مع المشاعر

"[Excited] I have great news to share with everyone! ([متحمس] لدي أخبار رائعة لمشاركتها مع الجميع!)"

كيفية استخدام IndexTTS

اتبع هذه الخطوات البسيطة لإنشاء كلام عالي الجودة من النص الخاص بك

1

جهز النص الخاص بك

أدخل أو الصق النص الذي تريد تحويله إلى كلام. استخدم علامات الترقيم المناسبة وأضف تلميحات النطق إذا لزم الأمر.

2

تحميل الصوت المرجعي (اختياري)

لاستنساخ الصوت، قم بتحميل عينة صوتية واضحة لمدة 5-10 ثوانٍ للصوت المستهدف. تخط هذه الخطوة لاستخدام الأصوات الافتراضية.

3

حدد اللغة والعاطفة

اختر لغتك الأساسية (الصينية/الإنجليزية) وحدد علامة عاطفية إذا كنت تريد كلامًا معبرًا.

4

إنشاء وتنزيل

انقر فوق إنشاء لإنشاء الصوت الخاص بك. قم بمعاينة النتيجة وقم بتنزيل ملف الصوت عند الرضا.

نصائح سريعة

  • يجب أن يكون الصوت المرجعي واضحًا مع الحد الأدنى من الضوضاء في الخلفية للحصول على أفضل نتائج استنساخ الصوت
  • قد تستغرق النصوص الأطول وقتًا أطول للمعالجة - فكر في تقسيمها إلى أجزاء أصغر
  • جرب أنماط علامات الترقيم المختلفة لتحقيق إيقاع الكلام الذي تريده
  • بالنسبة للنص الصيني، يمكن لتصحيحات بينيين تحسين دقة النطق بشكل كبير

تعتمد جودة الكلام الذي تم إنشاؤه على وضوح النص المدخل وجودة الصوت المرجعي (لاستنساخ الصوت). للحصول على أفضل النتائج، استخدم نصًا منسقًا جيدًا مع علامات ترقيم طبيعية.

FAQ

الأسئلة الشائعة

ابحث عن إجابات للأسئلة الشائعة حول IndexTTS

هل أنت مستعد لإنشاء كلام طبيعي؟

ابدأ في استخدام IndexTTS اليوم لتحويل النص الخاص بك إلى كلام عالي الجودة وطبيعي المظهر مع إمكانات استنساخ صوت متقدمة

تم تدريب IndexTTS على 25000 ساعة من الصوت الصيني و 9000 ساعة من الصوت الإنجليزي، مما يضمن جودة احترافية لمشاريعك