Question 1

¿Qué hablantes están disponibles en VibeVoice?

Accepted Answer

VibeVoice ofrece 6 voces de hablantes: Frank, Wayne, Carter, Emma, Grace y Mike. Cada voz tiene características únicas adecuadas para diferentes tipos de contenido, desde narración hasta voces de personajes.

Question 2

¿Qué es el parámetro de escala CFG?

Accepted Answer

La escala CFG (Guía sin Clasificador) controla qué tan estrechamente la voz generada se adhiere al texto de entrada. Valores más altos (hasta 3.0) aumentan la adherencia al texto, mientras valores más bajos (tan bajos como 0.5) permiten más variación creativa. El valor predeterminado es 1.3 para resultados equilibrados.

Question 3

¿Cómo funciona el parámetro de semilla?

Accepted Answer

El parámetro de semilla te permite controlar la aleatoriedad en la generación. Usar el mismo valor de semilla con el mismo texto producirá resultados idénticos, lo cual es útil para generación reproducible y pruebas.

Question 4

¿Cuál es la calidad de audio de la salida de VibeVoice?

Accepted Answer

VibeVoice genera audio a 24kHz de frecuencia de muestreo, proporcionando voz de alta calidad, clara y natural. La salida es adecuada para trabajo profesional de doblaje y creación de contenido.

Question 5

¿Qué tan rápida es la generación de VibeVoice?

Accepted Answer

VibeVoice está optimizado para generación rápida, haciéndolo adecuado para aplicaciones en tiempo real y medios interactivos. La velocidad de generación depende de la longitud del texto y la carga del servidor, pero típicamente se completa en segundos.

Question 6

¿Puedo usar VibeVoice para proyectos comerciales?

Accepted Answer

Sí, puedes usar el audio generado por VibeVoice para proyectos comerciales incluyendo videos de YouTube, podcasts, e-learning, audiolibros, anuncios y más. Verifica los términos de licencia específicos para tu caso de uso.

Question 7

¿Cuál es la longitud máxima de texto para VibeVoice?

Accepted Answer

VibeVoice admite entrada de texto largo. Para textos muy largos, considera dividir en múltiples segmentos para rendimiento óptimo. El precio se calcula por cada 1000 caracteres.

Question 8

¿Cómo se calcula el precio para VibeVoice?

Accepted Answer

VibeVoice cobra 6 créditos por cada 1000 caracteres de texto. El texto debajo de 1000 caracteres se redondea hacia arriba a 1000. Esto lo hace una de las soluciones TTS más rentables disponibles.

Formato de salida	Audio de alta calidad (MP3)
Frecuencia de muestreo	24kHz
Tiempo de procesamiento	Generación rápida
Costo	6 créditos por 1000 caracteres
Rango de escala CFG	0.5 - 3.0
Hablantes disponibles	6 voces (Frank, Wayne, Carter, Emma, Grace, Mike)
Generación reproducible	Sí (vía parámetro de semilla)

VibeVoice - Texto a Voz

Save Your Audios

Community Audios

¿Qué puede hacer VibeVoice?

Múltiples Voces de Hablantes

Generación Rápida

Escala CFG Ajustable

Salida de Audio de Alta Calidad

Generación Reproducible

IA de Código Abierto

Cómo usar VibeVoice

Ingresa tu Texto

Selecciona un Hablante

Ajusta Configuración (Opcional)

Genera y Descarga

Frequently Asked Questions