En Voice 3.0, podrás elegir entre los siguientes tipos de voces
● Voces Estándar: son voces generadas utilizando métodos convencionales de síntesis de voz, como la concatenación de unidades de sonido pregrabadas o algoritmos simples de modificación de formas de onda. Aunque son menos avanzadas en términos de calidad y flexibilidad en comparación con las voces neurales, siguen siendo una opción disponible.
● Voces Studio: son generadas utilizando tecnologías de síntesis de voz tradicionales, como la concatenación de unidades de sonido pregrabadas. A menudo, pueden ser menos naturales y expresivas en comparación con las voces generadas por tecnologías más avanzadas.
● WaveNet: es una tecnología de síntesis de voz, que utiliza redes neuronales profundas para modelar directamente las ondas de audio, lo que permite una generación de voz más natural y fluida. Las voces generadas con WaveNet tienden a un alto grado de realismo y expresividad.
● Neural2: es una tecnología de síntesis de voz basada en redes neuronales, que constituye una evolución o versión mejorada de WaveNet, agregando mejoras tanto en la calidad de la voz generada como en la eficiencia computacional en comparación con las tecnologías anteriores.
El tipo de voz, lo seleccionarás en el proceso de creación de tu canal Voice.
Aquí podrás conocer las diferentes voces disponibles.