Story321.com

VibeVoice - Synthèse Vocale

Générez une voix expressive à partir de texte en utilisant VibeVoice 0.5b. IA de synthèse vocale rapide et open source avec plusieurs options de voix.

Save Your Audios

Login to save, manage and share all your generated audios

Community Audios

Que peut faire VibeVoice ?

Plusieurs Voix de Locuteurs

Choisissez parmi 6 voix de locuteurs différentes incluant Frank, Wayne, Carter, Emma, Grace et Mike. Chaque voix a des caractéristiques uniques pour divers types de contenu.

Génération Rapide

Générez rapidement la parole avec un traitement optimisé. Parfait pour les applications en temps réel, assistants vocaux et médias interactifs.

Échelle CFG Ajustable

Contrôlez l'adhérence au texte avec le paramètre d'échelle CFG. Des valeurs plus élevées augmentent l'adhérence au texte, des valeurs plus basses permettent plus de variation créative.

Sortie Audio Haute Qualité

Produit un audio à 24kHz pour une parole claire et naturelle. Adapté pour le travail professionnel de doublage.

Génération Reproductible

Utilisez des valeurs de seed pour des résultats reproductibles. Parfait pour maintenir la cohérence sur plusieurs générations du même texte.

IA Open Source

Construit sur une technologie open source pour la transparence et les améliorations pilotées par la communauté. Synthèse vocale haute qualité accessible à tous.

Comment utiliser VibeVoice

1

Entrez votre Texte

Tapez ou collez le script que vous souhaitez convertir en parole. VibeVoice générera une parole naturelle à partir de votre texte.

2

Sélectionnez un Locuteur

Choisissez parmi 6 voix de locuteurs disponibles : Frank, Wayne, Carter, Emma, Grace ou Mike. Chaque voix a des caractéristiques uniques.

3

Ajustez les Paramètres (Optionnel)

Ajustez finement l'échelle CFG pour contrôler l'adhérence au texte. Utilisez une valeur de seed pour des résultats reproductibles si nécessaire.

4

Générez et Téléchargez

Cliquez sur Générer pour créer votre audio. Téléchargez le fichier MP3 haute qualité pour l'utiliser dans vos projets.

Frequently Asked Questions

Quels locuteurs sont disponibles dans VibeVoice ?

VibeVoice offre 6 voix de locuteurs : Frank, Wayne, Carter, Emma, Grace et Mike. Chaque voix a des caractéristiques uniques adaptées à différents types de contenu, de la narration aux voix de personnages.

Qu'est-ce que le paramètre d'échelle CFG ?

L'échelle CFG (Guidance sans Classificateur) contrôle la proximité de la parole générée avec le texte d'entrée. Des valeurs plus élevées (jusqu'à 3.0) augmentent l'adhérence au texte, tandis que des valeurs plus basses (aussi basses que 0.5) permettent plus de variation créative. La valeur par défaut est 1.3 pour des résultats équilibrés.

Comment fonctionne le paramètre seed ?

Le paramètre seed vous permet de contrôler l'aléatoire dans la génération. Utiliser la même valeur de seed avec le même texte produira des résultats identiques, ce qui est utile pour la génération reproductible et les tests.

Quelle est la qualité audio de la sortie VibeVoice ?

VibeVoice génère de l'audio à 24kHz, fournissant une parole de haute qualité, claire et naturelle. La sortie est adaptée pour le travail professionnel de doublage et la création de contenu.

Quelle est la vitesse de génération de VibeVoice ?

VibeVoice est optimisé pour une génération rapide, le rendant adapté aux applications en temps réel et aux médias interactifs. La vitesse de génération dépend de la longueur du texte et de la charge du serveur, mais se termine généralement en quelques secondes.

Puis-je utiliser VibeVoice pour des projets commerciaux ?

Oui, vous pouvez utiliser l'audio généré par VibeVoice pour des projets commerciaux incluant des vidéos YouTube, podcasts, e-learning, livres audio, publicités et plus. Vérifiez les termes de licence spécifiques pour votre cas d'utilisation.

Quelle est la longueur maximale de texte pour VibeVoice ?

VibeVoice prend en charge l'entrée de texte longue. Pour des textes très longs, envisagez de diviser en plusieurs segments pour une performance optimale. La tarification est calculée par 1000 caractères.

Comment la tarification est-elle calculée pour VibeVoice ?

VibeVoice facture 6 crédits par 1000 caractères de texte. Le texte sous 1000 caractères est arrondi à 1000. Cela en fait l'une des solutions TTS les plus rentables disponibles.

Tarification

Niveau gratuit disponible

Synthèse Vocale6 crédits par 1000 caractères

Spécifications Techniques

Format de sortieAudio haute qualité (MP3)
Taux d'échantillonnage24kHz
Temps de traitementGénération rapide
Coût6 crédits par 1000 caractères
Plage d'échelle CFG0.5 - 3.0
Locuteurs disponibles6 voix (Frank, Wayne, Carter, Emma, Grace, Mike)
Génération reproductibleOui (via paramètre seed)