Save Your Audios
Login to save, manage and share all your generated audios
Community Audios
VibeVoice 可以做什麼?
多種說話人聲音
從 6 種不同的說話人聲音中選擇,包括 Frank、Wayne、Carter、Emma、Grace 和 Mike。每個聲音都有獨特的特徵,適合各種內容類型。
快速生成
使用優化的處理快速生成語音。非常適合即時應用程式、語音助理和互動媒體。
可調整的 CFG 比例
使用 CFG 比例參數控制對文字的 adherence。更高的值增加對文字的遵循度,更低的值允許更多創意變化。
高品質音訊輸出
生成 24kHz 取樣率的音訊,提供清晰、自然的語音。適合專業的配音工作。
可重現的生成
使用種子值獲得可重現的結果。非常適合在同一文字的多次生成中保持一致性。
開源 AI
基於開源技術建構,提供透明度和社群驅動的改進。讓高品質的語音合成觸手可及。
如何使用 VibeVoice
輸入您的文字
輸入或貼上您要轉換為語音的腳本。VibeVoice 將從您的文字生成自然的語音。
選擇說話人
從 6 個可用的說話人聲音中選擇:Frank、Wayne、Carter、Emma、Grace 或 Mike。每個聲音都有獨特的特徵。
調整設定(可選)
微調 CFG 比例以控制對文字的遵循度。如需要,使用種子值獲得可重現的結果。
生成並下載
點擊生成以建立您的音訊。下載高品質 MP3 檔案以在您的專案中使用。
Frequently Asked Questions
VibeVoice 有哪些說話人可選?
▼
VibeVoice 提供 6 個說話人聲音:Frank、Wayne、Carter、Emma、Grace 和 Mike。每個聲音都有獨特的特徵,適合不同的內容類型,從旁白到角色聲音。
CFG 比例參數是什麼?
▼
CFG(無分類器指導)比例控制生成的語音與輸入文字的密切程度。更高的值(高達 3.0)增加對文字的遵循度,而更低的值(低至 0.5)允許更多創意變化。預設值為 1.3 以獲得平衡的結果。
種子參數如何運作?
▼
種子參數允許您控制生成中的隨機性。使用相同的種子值和相同的文字將產生相同的結果,這對於可重現的生成和測試很有用。
VibeVoice 輸出的音訊品質如何?
▼
VibeVoice 以 24kHz 取樣率生成音訊,提供高品質、清晰和自然的語音。輸出適合專業的配音工作和內容創作。
VibeVoice 生成有多快?
▼
VibeVoice 針對快速生成進行了最佳化,使其適合即時應用程式和互動媒體。生成速度取決於文字長度和伺服器負載,但通常在幾秒鐘內完成。
我可以將 VibeVoice 用於商業專案嗎?
▼
是的,您可以將 VibeVoice 生成的音訊用於商業專案,包括 YouTube 影片、Podcast、電子學習、有聲書、廣告等。請查看您用例的具體授權條款。
VibeVoice 的最大文字長度是多少?
▼
VibeVoice 支援長文字輸入。對於非常長的文字,建議分成多個段落以獲得最佳效能。定價按每 1000 個字元計算。
VibeVoice 的定價如何計算?
▼
VibeVoice 每 1000 個字元文字收取 6 個積分。不足 1000 個字元的文字按 1000 計算。這使其成為最具成本效益的 TTS 解決方案之一。
定價
提供免費層級
技術規格
| 輸出格式 | 高品質音訊 (MP3) |
| 取樣率 | 24kHz |
| 處理時間 | 快速生成 |
| 成本 | 每 1000 個字元 6 個積分 |
| CFG 比例範圍 | 0.5 - 3.0 |
| 可用說話人 | 6 種聲音 (Frank, Wayne, Carter, Emma, Grace, Mike) |
| 可重現生成 | 是(透過種子參數) |