Optimización de puntos de concatenación por análisis de componentes principales
Contenido principal del artículo
Resumen
En general, los sistemas de síntesis de voz concatenada proporcionan una calidad de síntesis considerable ya que los criterios de selección de unidades de selección de unidades se han optimizado. Sin embargo, el nivel de calidad de la síntesis depende de la posición adecuada de los puntos de concatenación de todas las unidades acústicas que deben que deben concatenarse. La posición de los puntos de concatenación determina en gran medida el grado de desajuste y distorsión de la percepción humana en una forma de onda sintetizada. Por lo tanto presentamos un algoritmo de optimización de puntos de concatenación (CPO) basado en el Análisis de Componentes Principales (PCA) que establece un punto de concatenación óptimo entre dos unidades acústicas unidades acústicas coincidentes en un inventario dado y reduce la distorsionar la percepción humana en los sistemas de síntesis de texto a voz (TTS) Sistemas. El algoritmo extrae tramas de datos referidas a un punto de concatenación y los transforma, mediante PCA, en un marco particular, preservando las propiedades relevantes de la forma de onda. Después, determinamos el punto óptimo de punto de concatenación mediante una optimización de la tarea. Las evaluaciones experimentales de experimentales caracterizan el comportamiento del método de optimización del punto de concatenación propuesto y destacan su viabilidad.