VibeVoice - Texto a Voz
Genera voz expresiva a partir de texto usando VibeVoice 0.5b. IA de síntesis de voz de código abierto rápida con múltiples opciones de voces.
Genera voz expresiva a partir de texto usando VibeVoice 0.5b. IA de síntesis de voz de código abierto rápida con múltiples opciones de voces.
Save Your Audios
Login to save, manage and share all your generated audios
Community Audios
¿Qué puede hacer VibeVoice?
Múltiples Voces de Hablantes
Elige entre 6 voces de hablantes diferentes incluyendo Frank, Wayne, Carter, Emma, Grace y Mike. Cada voz tiene características únicas para varios tipos de contenido.
Generación Rápida
Genera voz rápidamente con procesamiento optimizado. Perfecto para aplicaciones en tiempo real, asistentes de voz y medios interactivos.
Escala CFG Ajustable
Controla la adherencia al texto con el parámetro de escala CFG. Valores más altos aumentan la adherencia al texto, valores más bajos permiten más variación creativa.
Salida de Audio de Alta Calidad
Produce audio a 24kHz de frecuencia de muestreo para voz clara y natural. Adecuado para trabajo profesional de doblaje.
Generación Reproducible
Usa valores de semilla para resultados reproducibles. Perfecto para mantener consistencia en múltiples generaciones del mismo texto.
IA de Código Abierto
Construido sobre tecnología de código abierto para transparencia y mejoras impulsadas por la comunidad. Síntesis de voz de alta calidad accesible para todos.
Cómo usar VibeVoice
Ingresa tu Texto
Escribe o pega el guión que deseas convertir a voz. VibeVoice generará voz natural a partir de tu texto.
Selecciona un Hablante
Elige entre 6 voces de hablantes disponibles: Frank, Wayne, Carter, Emma, Grace o Mike. Cada voz tiene características únicas.
Ajusta Configuración (Opcional)
Ajusta finamente la escala CFG para controlar la adherencia al texto. Usa un valor de semilla para resultados reproducibles si es necesario.
Genera y Descarga
Haz clic en Generar para crear tu audio. Descarga el archivo MP3 de alta calidad para usar en tus proyectos.
Frequently Asked Questions
¿Qué hablantes están disponibles en VibeVoice?
▼
VibeVoice ofrece 6 voces de hablantes: Frank, Wayne, Carter, Emma, Grace y Mike. Cada voz tiene características únicas adecuadas para diferentes tipos de contenido, desde narración hasta voces de personajes.
¿Qué es el parámetro de escala CFG?
▼
La escala CFG (Guía sin Clasificador) controla qué tan estrechamente la voz generada se adhiere al texto de entrada. Valores más altos (hasta 3.0) aumentan la adherencia al texto, mientras valores más bajos (tan bajos como 0.5) permiten más variación creativa. El valor predeterminado es 1.3 para resultados equilibrados.
¿Cómo funciona el parámetro de semilla?
▼
El parámetro de semilla te permite controlar la aleatoriedad en la generación. Usar el mismo valor de semilla con el mismo texto producirá resultados idénticos, lo cual es útil para generación reproducible y pruebas.
¿Cuál es la calidad de audio de la salida de VibeVoice?
▼
VibeVoice genera audio a 24kHz de frecuencia de muestreo, proporcionando voz de alta calidad, clara y natural. La salida es adecuada para trabajo profesional de doblaje y creación de contenido.
¿Qué tan rápida es la generación de VibeVoice?
▼
VibeVoice está optimizado para generación rápida, haciéndolo adecuado para aplicaciones en tiempo real y medios interactivos. La velocidad de generación depende de la longitud del texto y la carga del servidor, pero típicamente se completa en segundos.
¿Puedo usar VibeVoice para proyectos comerciales?
▼
Sí, puedes usar el audio generado por VibeVoice para proyectos comerciales incluyendo videos de YouTube, podcasts, e-learning, audiolibros, anuncios y más. Verifica los términos de licencia específicos para tu caso de uso.
¿Cuál es la longitud máxima de texto para VibeVoice?
▼
VibeVoice admite entrada de texto largo. Para textos muy largos, considera dividir en múltiples segmentos para rendimiento óptimo. El precio se calcula por cada 1000 caracteres.
¿Cómo se calcula el precio para VibeVoice?
▼
VibeVoice cobra 6 créditos por cada 1000 caracteres de texto. El texto debajo de 1000 caracteres se redondea hacia arriba a 1000. Esto lo hace una de las soluciones TTS más rentables disponibles.
Precios
Nivel gratuito disponible
Especificaciones Técnicas
| Formato de salida | Audio de alta calidad (MP3) |
| Frecuencia de muestreo | 24kHz |
| Tiempo de procesamiento | Generación rápida |
| Costo | 6 créditos por 1000 caracteres |
| Rango de escala CFG | 0.5 - 3.0 |
| Hablantes disponibles | 6 voces (Frank, Wayne, Carter, Emma, Grace, Mike) |
| Generación reproducible | Sí (vía parámetro de semilla) |