Question 1

제로 샷 음성 복제는 어떻게 작동하나요?

Accepted Answer

Chat터박스 터보는 단 5초 분량의 참조 오디오만으로 어떤 음성이든 복제할 수 있습니다. 오디오 파일을 업로드하기만 하면 모델이 훈련이나 미세 조정 없이 스타일, 어조 및 특성을 일치시킵니다.

Question 2

어떤 언어외적 태그가 지원되나요?

Accepted Answer

Chat터박스 터보는 , , , , , , 및 를 포함한 여러 자연스러운 음성 반응 태그를 지원합니다. 이러한 태그는 일치하는 감정적 어조로 복제된 음성에서 자연스러운 반응을 생성합니다.

Question 3

Chat터박스 터보는 얼마나 빠르나요?

Accepted Answer

Chat터박스 터보는 GPU에서 실시간보다 최대 6배 빠르게 음성을 생성합니다. 따라서 속도가 중요한 실시간 애플리케이션, 음성 비서 및 인터랙티브 미디어에 적합합니다.

Question 4

과장 매개변수는 무엇인가요?

Accepted Answer

과장 매개변수 (0.0-1.0)는 음성 표현력을 제어합니다. 값이 낮을수록 단조로운 음성을 만들고, 값이 높을수록 음성을 더욱 극적이고 표현력 있게 만듭니다. 자연스러운 전달을 위해 기본값은 0.25입니다.

Question 5

입력 및 출력에 지원되는 오디오 형식은 무엇인가요?

Accepted Answer

MP3, WAV 또는 MPEG 형식으로 참조 오디오를 업로드할 수 있습니다. Chat터박스 터보는 모든 전문적인 사용 사례에 적합한 고품질 오디오 출력을 생성합니다.

Question 6

가격은 어떻게 계산되나요?

Accepted Answer

Chat터박스 터보는 텍스트 1000자당 6 크레딧을 부과합니다. 1000자 미만의 텍스트는 1000자로 반올림됩니다. 이는 가장 비용 효율적인 전문 TTS 솔루션 중 하나입니다.

Question 7

내장된 워터마킹은 무엇을 하나요?

Accepted Answer

Chat터박스 터보에서 생성된 모든 오디오 파일에는 PerTh (Perceptual Threshold) 워터마커가 포함되어 있습니다. 이 심층 신경망 워터마커는 데이터를 감지할 수 없는 방식으로 포함하여 오디오 품질 저하 없이 책임감 있는 AI 배포를 위해 AI 생성 콘텐츠를 추적하는 데 도움이 됩니다.

출력 형식	고품질 오디오
참조 오디오	복제에 필요한 5초
처리 시간	실시간보다 최대 6배 빠름
비용	1000자당 6 크레딧
과장 범위	0.0 - 1.0
온도 범위	0.05 - 5.0
라이선스	MIT (오픈 소스)
워터마킹	내장된 PerTH

Chat터박스 터보 - 텍스트 음성 변환

Save Your Audios

Community Audios

Chat터박스 터보는 무엇을 할 수 있나요?

제로 샷 음성 복제

언어외적 감정

감정 과장 제어

내장 워터마킹

초고속 생성

오픈 소스 및 MIT 라이선스

Chat터박스 터보 사용법

텍스트 입력

참조 오디오 업로드(선택 사항)

설정 조정

생성 및 다운로드

Frequently Asked Questions