Q: どのようなパラ言語タグがサポートされていますか？

Chatterbox Turboは、 、 、 、 、 、 、 、 など、複数の自然なボーカルリアクションタグをサポートしています。これらのタグは、一致する感情的なトーンで、クローンされた音声で自然な反応を生成します。

Question 1

ゼロショット音声クローン作成はどのように機能しますか？

Accepted Answer

Chatterbox Turboは、わずか5秒の参照オーディオでどんな声でもクローンできます。オーディオファイルをアップロードするだけで、モデルはトレーニングや微調整を必要とせずに、スタイル、トーン、特性を一致させます。

Question 2

どのようなパラ言語タグがサポートされていますか？

Accepted Answer

Chatterbox Turboは、、、、、、、、など、複数の自然なボーカルリアクションタグをサポートしています。これらのタグは、一致する感情的なトーンで、クローンされた音声で自然な反応を生成します。

Question 3

Chatterbox Turboはどのくらい高速ですか？

Accepted Answer

Chatterbox Turboは、GPUでリアルタイムの最大6倍高速に音声を生成します。これにより、速度が重要なリアルタイムアプリケーション、音声アシスタント、インタラクティブメディアに最適です。

Question 4

誇張パラメーターとは何ですか？

Accepted Answer

誇張パラメーター（0.0〜1.0）は、音声の表現力を制御します。値が低いほどモノトーンの音声になり、値が高いほど音声がより劇的で表現豊かになります。自然な配信の場合、デフォルトは0.25です。

Question 5

入力および出力でサポートされているオーディオ形式は何ですか？

Accepted Answer

MP3、WAV、MPEG形式で参照オーディオをアップロードできます。Chatterbox Turboは、あらゆるプロフェッショナルなユースケースに適した高品質のオーディオ出力を生成します。

Question 6

価格はどのように計算されますか？

Accepted Answer

Chatterbox Turboは、テキスト1000文字あたり6クレジットを請求します。1000文字未満のテキストは1000文字に切り上げられます。これにより、最も費用対効果の高いプロフェッショナルTTSソリューションの1つになります。

Question 7

組み込みのウォーターマークは何をしますか？

Accepted Answer

Chatterbox Turboによって生成されたすべてのオーディオファイルには、PerTh（知覚閾値）ウォーターマーカーが含まれています。この深層ニューラルネットワークウォーターマーカーは、データを認識できない方法で埋め込み、オーディオ品質を損なうことなく、責任あるAI展開のためにAI生成コンテンツを追跡するのに役立ちます。

出力フォーマット	高品質オーディオ
参照オーディオ	クローン作成には5秒必要
処理時間	リアルタイムの最大6倍高速
コスト	1000文字あたり6クレジット
誇張範囲	0.0〜1.0
温度範囲	0.05〜5.0
ライセンス	MIT（オープンソース）
ウォーターマーク	組み込みPerTH

Chatterbox Turbo - テキスト読み上げ

Save Your Audios

Community Audios

Chatterbox Turboで何ができますか？

ゼロショット音声クローン作成

パラ言語的感情

感情誇張コントロール

組み込みのウォーターマーク

超高速生成

オープンソース＆MITライセンス

Chatterbox Turboの使用方法

テキストを入力

参照オーディオをアップロード（オプション）

設定を調整

生成とダウンロード

Frequently Asked Questions