Story321.com

Chat터박스 터보 - 텍스트 음성 변환

Chat터박스 터보를 사용하여 텍스트에서 표현력이 풍부하고 자연스러운 음성으로 변환하세요. 빠른 오픈 소스 AI로 워터마크가 내장되어 있으며 제로 샷 음성 복제가 가능합니다.

Save Your Audios

Login to save, manage and share all your generated audios

Community Audios

Chat터박스 터보는 무엇을 할 수 있나요?

제로 샷 음성 복제

단 5초 분량의 참조 오디오만으로 어떤 음성이든 복제하세요. 훈련이 필요하지 않습니다. 프로젝트 전체에서 일관된 음성 해설을 만드는 데 적합합니다.

언어외적 감정

<laugh>, <sigh>, <cough>, <gasp>와 같은 텍스트 기반 태그를 사용하여 자연스러운 음성 반응을 추가하세요. 음성을 정말 사람처럼 들리게 만듭니다.

감정 과장 제어

단일 매개변수로 단조로운 음성에서 극적으로 표현력이 풍부한 음성으로 음성 표현력을 조정합니다. 모든 콘텐츠 톤에 적합합니다.

내장 워터마킹

모든 오디오 출력물에는 책임감 있는 AI 배포를 위해 PerTh 워터마크가 포함되어 있습니다. 품질 저하 없이 AI 생성 콘텐츠를 추적하세요.

초고속 생성

GPU에서 실시간보다 최대 6배 빠릅니다. 실시간 애플리케이션, 음성 비서 및 인터랙티브 미디어에 적합합니다.

오픈 소스 및 MIT 라이선스

속도나 품질을 저하시키지 않는 최초의 오픈 소스 TTS입니다. 프로덕션을 위해 제작되었으며 개발자를 위해 설계되었습니다.

Chat터박스 터보 사용법

1

텍스트 입력

음성으로 변환하려는 텍스트를 입력하거나 붙여넣으세요. 자연스러운 표현을 위해 <laugh> 또는 <sigh>와 같은 감정 태그를 추가하세요.

2

참조 오디오 업로드(선택 사항)

어떤 음성이든 복제하려면 5초 분량의 오디오를 업로드하세요. 기본 음성을 사용하려면 이 단계를 건너뛰세요.

3

설정 조정

과장, 온도 및 창의성 매개변수를 제어하여 음성 출력을 미세 조정합니다.

4

생성 및 다운로드

생성을 클릭하고 고품질 오디오를 몇 초 안에 받으세요. 다운로드하여 어디든 사용하세요.

Frequently Asked Questions

제로 샷 음성 복제는 어떻게 작동하나요?

Chat터박스 터보는 단 5초 분량의 참조 오디오만으로 어떤 음성이든 복제할 수 있습니다. 오디오 파일을 업로드하기만 하면 모델이 훈련이나 미세 조정 없이 스타일, 어조 및 특성을 일치시킵니다.

어떤 언어외적 태그가 지원되나요?

Chat터박스 터보는 <laugh>, <chuckle>, <sigh>, <cough>, <sniffle>, <groan>, <yawn> 및 <gasp>를 포함한 여러 자연스러운 음성 반응 태그를 지원합니다. 이러한 태그는 일치하는 감정적 어조로 복제된 음성에서 자연스러운 반응을 생성합니다.

Chat터박스 터보는 얼마나 빠르나요?

Chat터박스 터보는 GPU에서 실시간보다 최대 6배 빠르게 음성을 생성합니다. 따라서 속도가 중요한 실시간 애플리케이션, 음성 비서 및 인터랙티브 미디어에 적합합니다.

과장 매개변수는 무엇인가요?

과장 매개변수 (0.0-1.0)는 음성 표현력을 제어합니다. 값이 낮을수록 단조로운 음성을 만들고, 값이 높을수록 음성을 더욱 극적이고 표현력 있게 만듭니다. 자연스러운 전달을 위해 기본값은 0.25입니다.

입력 및 출력에 지원되는 오디오 형식은 무엇인가요?

MP3, WAV 또는 MPEG 형식으로 참조 오디오를 업로드할 수 있습니다. Chat터박스 터보는 모든 전문적인 사용 사례에 적합한 고품질 오디오 출력을 생성합니다.

가격은 어떻게 계산되나요?

Chat터박스 터보는 텍스트 1000자당 6 크레딧을 부과합니다. 1000자 미만의 텍스트는 1000자로 반올림됩니다. 이는 가장 비용 효율적인 전문 TTS 솔루션 중 하나입니다.

내장된 워터마킹은 무엇을 하나요?

Chat터박스 터보에서 생성된 모든 오디오 파일에는 PerTh (Perceptual Threshold) 워터마커가 포함되어 있습니다. 이 심층 신경망 워터마커는 데이터를 감지할 수 없는 방식으로 포함하여 오디오 품질 저하 없이 책임감 있는 AI 배포를 위해 AI 생성 콘텐츠를 추적하는 데 도움이 됩니다.

가격

무료 티어 사용 가능

텍스트 음성 변환1000자당 6 크레딧

기술 사양

출력 형식고품질 오디오
참조 오디오복제에 필요한 5초
처리 시간실시간보다 최대 6배 빠름
비용1000자당 6 크레딧
과장 범위0.0 - 1.0
온도 범위0.05 - 5.0
라이선스MIT (오픈 소스)
워터마킹내장된 PerTH