Herramienta para reducir automáticamente la duración de un discurso en ingles adaptada a las características de voz de un hablante [recurso electrónico]Trabajo de Grado / CD-ROM - Trabajo de Grado
El desarrollo de la herramienta se dividió en tres fases: etiquetado manual de segmentos importantes de un audio, extracción de parámetros (características) del audio y entrenamiento del sistema. En la etapa de etiquetado se desarrolló una aplicación web que permitió aligerar el proceso. La extracción de características se realizó con la librería MIRTOOLBOX, y en la implementación de clasificadores e interfaz de la herramienta se utilizó MATLAB. Se compararon cinco clasificadores: Análisis discriminante lineal (ADL), Análisis discriminante cuadrático (ADC), Regresión logística, Redes neuronales artificiales (RNA) y Máquinas de soporte vectorial (MSV), donde los mejores resultados se obtuvieron con RNA: 79.19% de exactitud y MSV: 81.21% de exactitud. Se realizaron pruebas para medir el porcentaje de reducción con tres audios nuevos. Estas pruebas arrojaron un promedio de reducción de 27.34 % usando RNA y 24.50 % usando MSV. Además se hicieron pruebas de comprensión de un audio reducido con la herramienta desarrollada y se encontró una pérdida de información del 16.67 %. Se concluyó que los parámetros prosódicos y espectrales aportan datos suficientes para realizar una clasificación de importancia relativa. También se encontró que mezclando las características prosódicas y espectrales en un mismo conjunto de datos se obtiene la mayor exactitud.