
● Voces Estándar: son voces generadas utilizando métodos convencionales de síntesis de voz, como la concatenación de unidades de sonido pregrabadas o algoritmos simples de modificación de formas de onda. Aunque son menos avanzadas en términos de calidad y flexibilidad en comparación con las voces neurales, siguen siendo una opción disponible.
● Voces Studio: son generadas utilizando tecnologías de síntesis de voz tradicionales, como la concatenación de unidades de sonido pregrabadas. A menudo, pueden ser menos naturales y expresivas en comparación con las voces generadas por tecnologías más avanzadas.
● WaveNet: es una tecnología de síntesis de voz, que utiliza redes neuronales profundas para modelar directamente las ondas de audio, lo que permite una generación de voz más natural y fluida. Las voces generadas con WaveNet tienden a un alto grado de realismo y expresividad.
● Neural2: es una tecnología de síntesis de voz basada en redes neuronales, que constituye una evolución o versión mejorada de WaveNet, agregando mejoras tanto en la calidad de la voz generada como en la eficiencia computacional en comparación con las tecnologías anteriores.

