Chatterbox Turbo - Synthèse vocale
Générez une parole expressive et naturelle à partir de texte grâce à Chatterbox Turbo. IA rapide et open source avec filigranage intégré et clonage vocal zero-shot.
Générez une parole expressive et naturelle à partir de texte grâce à Chatterbox Turbo. IA rapide et open source avec filigranage intégré et clonage vocal zero-shot.
Save Your Audios
Login to save, manage and share all your generated audios
Community Audios
Que peut faire Chatterbox Turbo ?
Clonage vocal zero-shot
Clonez n'importe quelle voix avec seulement 5 secondes d'audio de référence. Aucun entraînement requis. Parfait pour créer des voix off cohérentes sur tous vos projets.
Émotions paralinguistiques
Ajoutez des réactions vocales naturelles en utilisant des balises textuelles comme <rire>, <soupir>, <toux> et <halètement>. Rend la parole vraiment humaine.
Contrôle de l'exagération des émotions
Ajustez l'expressivité de la parole de monotone à dramatiquement expressive avec un seul paramètre. Parfait pour tous les styles de contenu.
Filigranage intégré
Chaque sortie audio inclut le filigranage PerTh pour un déploiement responsable de l'IA. Suivez le contenu généré par l'IA sans compromettre la qualité.
Génération ultra-rapide
Jusqu'à 6 fois plus rapide que le temps réel sur GPU. Parfait pour les applications en temps réel, les assistants vocaux et les médias interactifs.
Open Source et licence MIT
Le premier TTS open source qui ne fait aucun compromis sur la vitesse ou la qualité. Conçu pour la production, pensé pour les développeurs.
Comment utiliser Chatterbox Turbo
Entrez votre texte
Tapez ou collez le texte que vous souhaitez convertir en parole. Ajoutez des marqueurs d'émotion comme <rire> ou <soupir> pour des expressions naturelles.
Télécharger un audio de référence (facultatif)
Téléchargez 5 secondes d'audio pour cloner n'importe quelle voix. Ignorez cette étape pour utiliser la voix par défaut.
Ajuster les réglages
Contrôlez les paramètres d'exagération, de température et de créativité pour affiner votre sortie vocale.
Générer et télécharger
Cliquez sur Générer et recevez votre audio de haute qualité en quelques secondes. Téléchargez-le et utilisez-le n'importe où.
Frequently Asked Questions
Comment fonctionne le clonage vocal zero-shot ?
▼
Chatterbox Turbo peut cloner n'importe quelle voix avec seulement 5 secondes d'audio de référence. Téléchargez simplement votre fichier audio, et le modèle correspondra au style, au ton et aux caractéristiques sans aucun entraînement ou réglage fin nécessaire.
Quelles sont les balises paralinguistiques prises en charge ?
▼
Chatterbox Turbo prend en charge plusieurs balises de réaction vocale naturelle, notamment <rire>, <rire doucement>, <soupir>, <toux>, <reniflement>, <gémissement>, <bâillement> et <halètement>. Ces balises génèrent des réactions naturelles dans la voix clonée avec une tonalité émotionnelle correspondante.
Quelle est la rapidité de Chatterbox Turbo ?
▼
Chatterbox Turbo génère la parole jusqu'à 6 fois plus vite que le temps réel sur GPU. Cela le rend parfait pour les applications en temps réel, les assistants vocaux et les médias interactifs où la vitesse est essentielle.
Qu'est-ce que le paramètre d'exagération ?
▼
Le paramètre d'exagération (0.0-1.0) contrôle l'expressivité de la parole. Les valeurs plus basses créent une parole monotone, tandis que les valeurs plus élevées rendent la voix plus dramatique et expressive. La valeur par défaut est de 0.25 pour une diction naturelle.
Quels sont les formats audio pris en charge pour l'entrée et la sortie ?
▼
Vous pouvez télécharger de l'audio de référence aux formats MP3, WAV ou MPEG. Chatterbox Turbo génère une sortie audio de haute qualité adaptée à tout cas d'utilisation professionnelle.
Comment le prix est-il calculé ?
▼
Chatterbox Turbo facture 6 crédits par tranche de 1000 caractères de texte. Le texte de moins de 1000 caractères est arrondi à 1000. Cela en fait l'une des solutions TTS professionnelles les plus rentables disponibles.
Que fait le filigranage intégré ?
▼
Chaque fichier audio généré par Chatterbox Turbo inclut le filigrane PerTh (Perceptual Threshold). Ce filigrane de réseau neuronal profond intègre des données de manière imperceptible, vous aidant à suivre le contenu généré par l'IA pour un déploiement responsable de l'IA sans compromettre la qualité audio.
Tarification
Niveau gratuit disponible
Spécifications techniques
| Format de sortie | Audio de haute qualité |
| Audio de référence | 5 secondes requises pour le clonage |
| Temps de traitement | Jusqu'à 6 fois plus rapide que le temps réel |
| Coût | 6 crédits par tranche de 1000 caractères |
| Plage d'exagération | 0.0 - 1.0 |
| Plage de température | 0.05 - 5.0 |
| Licence | MIT (Open Source) |
| Filigranage | PerTH intégré |