Story321.com

Chatterbox Turbo - テキスト読み上げ

Chatterbox Turboを使用して、テキストから表情豊かで自然な音声を作成します。高速なオープンソースAIで、ウォーターマークが組み込まれており、ゼロショット音声クローン作成が可能です。

Save Your Audios

Login to save, manage and share all your generated audios

Community Audios

Chatterbox Turboで何ができますか?

ゼロショット音声クローン作成

わずか5秒の参照オーディオで、どんな声でもクローンを作成できます。トレーニングは不要です。プロジェクト全体で一貫したナレーションを作成するのに最適です。

パラ言語的感情

<laugh>、<sigh>、<cough>、<gasp>などのテキストベースのタグを使用して、自然なボーカルリアクションを追加します。これにより、音声が本当に人間らしく聞こえます。

感情誇張コントロール

モノトーンから劇的に表現豊かな音声まで、単一のパラメーターで音声の表現力を調整します。あらゆるコンテンツのトーンに最適です。

組み込みのウォーターマーク

すべてのオーディオ出力には、責任あるAI展開のためのPerThウォーターマークが含まれています。品質を損なうことなく、AI生成コンテンツを追跡します。

超高速生成

GPUでリアルタイムの最大6倍高速。リアルタイムアプリケーション、音声アシスタント、インタラクティブメディアに最適です。

オープンソース&MITライセンス

速度や品質を損なわない最初のオープンソースTTS。本番環境向けに構築され、開発者向けに設計されています。

Chatterbox Turboの使用方法

1

テキストを入力

音声に変換するテキストを入力または貼り付けます。<laugh>や<sigh>などの感情タグを追加して、自然な表現を加えましょう。

2

参照オーディオをアップロード(オプション)

5秒のオーディオをアップロードして、任意の音声をクローンします。デフォルトの音声を使用するには、このステップをスキップしてください。

3

設定を調整

誇張、温度、創造性のパラメーターを制御して、音声出力を微調整します。

4

生成とダウンロード

生成をクリックして、高品質のオーディオを数秒で受信します。ダウンロードして、どこでも使用できます。

Frequently Asked Questions

ゼロショット音声クローン作成はどのように機能しますか?

Chatterbox Turboは、わずか5秒の参照オーディオでどんな声でもクローンできます。オーディオファイルをアップロードするだけで、モデルはトレーニングや微調整を必要とせずに、スタイル、トーン、特性を一致させます。

どのようなパラ言語タグがサポートされていますか?

Chatterbox Turboは、<laugh>、<chuckle>、<sigh>、<cough>、<sniffle>、<groan>、<yawn>、<gasp>など、複数の自然なボーカルリアクションタグをサポートしています。これらのタグは、一致する感情的なトーンで、クローンされた音声で自然な反応を生成します。

Chatterbox Turboはどのくらい高速ですか?

Chatterbox Turboは、GPUでリアルタイムの最大6倍高速に音声を生成します。これにより、速度が重要なリアルタイムアプリケーション、音声アシスタント、インタラクティブメディアに最適です。

誇張パラメーターとは何ですか?

誇張パラメーター(0.0〜1.0)は、音声の表現力を制御します。値が低いほどモノトーンの音声になり、値が高いほど音声がより劇的で表現豊かになります。自然な配信の場合、デフォルトは0.25です。

入力および出力でサポートされているオーディオ形式は何ですか?

MP3、WAV、MPEG形式で参照オーディオをアップロードできます。Chatterbox Turboは、あらゆるプロフェッショナルなユースケースに適した高品質のオーディオ出力を生成します。

価格はどのように計算されますか?

Chatterbox Turboは、テキスト1000文字あたり6クレジットを請求します。1000文字未満のテキストは1000文字に切り上げられます。これにより、最も費用対効果の高いプロフェッショナルTTSソリューションの1つになります。

組み込みのウォーターマークは何をしますか?

Chatterbox Turboによって生成されたすべてのオーディオファイルには、PerTh(知覚閾値)ウォーターマーカーが含まれています。この深層ニューラルネットワークウォーターマーカーは、データを認識できない方法で埋め込み、オーディオ品質を損なうことなく、責任あるAI展開のためにAI生成コンテンツを追跡するのに役立ちます。

価格

フリープランあり

テキスト読み上げ1000文字あたり6クレジット

技術仕様

出力フォーマット高品質オーディオ
参照オーディオクローン作成には5秒必要
処理時間リアルタイムの最大6倍高速
コスト1000文字あたり6クレジット
誇張範囲0.0〜1.0
温度範囲0.05〜5.0
ライセンスMIT(オープンソース)
ウォーターマーク組み込みPerTH