Story321.com

VibeVoice - 文字轉語音

使用 VibeVoice 0.5b 從文字生成富有表現力的語音。快速、開源的 AI 語音合成,提供多種說話人選項。

Save Your Audios

Login to save, manage and share all your generated audios

Community Audios

VibeVoice 可以做什麼?

多種說話人聲音

從 6 種不同的說話人聲音中選擇,包括 Frank、Wayne、Carter、Emma、Grace 和 Mike。每個聲音都有獨特的特徵,適合各種內容類型。

快速生成

使用優化的處理快速生成語音。非常適合即時應用程式、語音助理和互動媒體。

可調整的 CFG 比例

使用 CFG 比例參數控制對文字的 adherence。更高的值增加對文字的遵循度,更低的值允許更多創意變化。

高品質音訊輸出

生成 24kHz 取樣率的音訊,提供清晰、自然的語音。適合專業的配音工作。

可重現的生成

使用種子值獲得可重現的結果。非常適合在同一文字的多次生成中保持一致性。

開源 AI

基於開源技術建構,提供透明度和社群驅動的改進。讓高品質的語音合成觸手可及。

如何使用 VibeVoice

1

輸入您的文字

輸入或貼上您要轉換為語音的腳本。VibeVoice 將從您的文字生成自然的語音。

2

選擇說話人

從 6 個可用的說話人聲音中選擇:Frank、Wayne、Carter、Emma、Grace 或 Mike。每個聲音都有獨特的特徵。

3

調整設定(可選)

微調 CFG 比例以控制對文字的遵循度。如需要,使用種子值獲得可重現的結果。

4

生成並下載

點擊生成以建立您的音訊。下載高品質 MP3 檔案以在您的專案中使用。

Frequently Asked Questions

VibeVoice 有哪些說話人可選?

VibeVoice 提供 6 個說話人聲音:Frank、Wayne、Carter、Emma、Grace 和 Mike。每個聲音都有獨特的特徵,適合不同的內容類型,從旁白到角色聲音。

CFG 比例參數是什麼?

CFG(無分類器指導)比例控制生成的語音與輸入文字的密切程度。更高的值(高達 3.0)增加對文字的遵循度,而更低的值(低至 0.5)允許更多創意變化。預設值為 1.3 以獲得平衡的結果。

種子參數如何運作?

種子參數允許您控制生成中的隨機性。使用相同的種子值和相同的文字將產生相同的結果,這對於可重現的生成和測試很有用。

VibeVoice 輸出的音訊品質如何?

VibeVoice 以 24kHz 取樣率生成音訊,提供高品質、清晰和自然的語音。輸出適合專業的配音工作和內容創作。

VibeVoice 生成有多快?

VibeVoice 針對快速生成進行了最佳化,使其適合即時應用程式和互動媒體。生成速度取決於文字長度和伺服器負載,但通常在幾秒鐘內完成。

我可以將 VibeVoice 用於商業專案嗎?

是的,您可以將 VibeVoice 生成的音訊用於商業專案,包括 YouTube 影片、Podcast、電子學習、有聲書、廣告等。請查看您用例的具體授權條款。

VibeVoice 的最大文字長度是多少?

VibeVoice 支援長文字輸入。對於非常長的文字,建議分成多個段落以獲得最佳效能。定價按每 1000 個字元計算。

VibeVoice 的定價如何計算?

VibeVoice 每 1000 個字元文字收取 6 個積分。不足 1000 個字元的文字按 1000 計算。這使其成為最具成本效益的 TTS 解決方案之一。

定價

提供免費層級

文字轉語音每 1000 個字元 6 個積分

技術規格

輸出格式高品質音訊 (MP3)
取樣率24kHz
處理時間快速生成
成本每 1000 個字元 6 個積分
CFG 比例範圍0.5 - 3.0
可用說話人6 種聲音 (Frank, Wayne, Carter, Emma, Grace, Mike)
可重現生成是(透過種子參數)