Detalles del Título
Detalles del Título

< Ant.
Retornar a Lista de ResultadosHitlist
Sig. >
 
Título Herramienta para reducir automáticamente la duración de un discurso en ingles adaptada a las características de voz de un hablante [recurso electrónico]Trabajo de Grado / CD-ROM - Trabajo de Grado
Autor(es) Alarcón Pedroza, Lebis Armando (Autor)
Gutiérrez Erazo, José Luis (Autor)
Gómez Escobar, Jairo Alejandro (Asesor)
Publicación Cali, Colombia : Universidad de San Buenaventura, Cali, 2015
Descripción Física 1 CD-Rom
Español;
Clasificación(es) 006.32
Materia(s) Redes neuronales (Computadores); Procesamiento digital de señales. dsp; Inteligencia artificial; Inteligencia artificial - Procesamiento de datos; Aprendizaje automático (Inteligencia artíficial); Habla; Audio digital;
Nota(s) Tesis (Ingeniero de Multimedia) -- Universidad de San Buenaventura. Facultad de Ingeniería, Cali, 2015
Títulos Relacionados Titulo Colectivo: Trabajos de Grado. Ingeniería Multimedia. USB
Resumen El desarrollo de la herramienta se dividió en tres fases: etiquetado manual de segmentos importantes de un audio, extracción de parámetros (características) del audio y entrenamiento del sistema. En la etapa de etiquetado se desarrolló una aplicación web que permitió aligerar el proceso. La extracción de características se realizó con la librería MIRTOOLBOX, y en la implementación de clasificadores e interfaz de la herramienta se utilizó MATLAB. Se compararon cinco clasificadores: Análisis discriminante lineal (ADL), Análisis discriminante cuadrático (ADC), Regresión logística, Redes neuronales artificiales (RNA) y Máquinas de soporte vectorial (MSV), donde los mejores resultados se obtuvieron con RNA: 79.19% de exactitud y MSV: 81.21% de exactitud. Se realizaron pruebas para medir el porcentaje de reducción con tres audios nuevos. Estas pruebas arrojaron un promedio de reducción de 27.34 % usando RNA y 24.50 % usando MSV. Además se hicieron pruebas de comprensión de un audio reducido con la herramienta desarrollada y se encontró una pérdida de información del 16.67 %. Se concluyó que los parámetros prosódicos y espectrales aportan datos suficientes para realizar una clasificación de importancia relativa. También se encontró que mezclando las características prosódicas y espectrales en un mismo conjunto de datos se obtiene la mayor exactitud.
Objetos Asociados Documento disponible en Biblioteca Digital
Disponibilidad
CodBarras Localización Estante Signatura Estado Categoría
010102792Biblioteca Fray Juan de Jesús Anaya Prada, O.F.M.Archivo - Tesis en CD-RomT006.32 A321h CD-ROMDisponibleTrabajo Grado