Capitulo IV: Resultados

Posted by RM | Posted in | Posted on 14:37

Capitulo IV: Resultados

En el capitulo II discutimos aspectos relacionados con tecnicasy metodologias aptas para reconocimiento de patrones, si bien algunas de ellas son utilizadas en procesamiento de voz no so n exclusivas de esta area. En el capitulo III, dimos una explicación de las señales del pulmon y sus caracteristicazs principales; una vez que se establecieron fundamentos del reconocimiento de patrones y se explico en si el patron del cual nos ocupamos en esta tesis, a countinuacion mostramos los experimentos y los relustados obtenidos y algunos analisis en torno a ellos.

3.1. Descripcion de los experimentos.

Los experimentos fueron realizados aplicando un sistema de reconocimiento implementado en varias versiones, durante varios proyectos y generaciones de estudiantes y tesistas. La respiración es una señal acustica que debido a su dependencia de la fisiologia humana, guarda similitud en muchos aspectos a la señal de voz. Por lo tanto, una de las aportaciones del presente trabajo asi como el de otros compañeros de otras generacion de la maestria, es la implementacion de metodologias exitosas en voz a la señal acustica de la respiración.

Especificamente los Modelos Mezclados Gaussianos (GMM) y los vectores acusticos MFCC son metodologias con mucho exitoen el reconocimiento de voz; una de las problematicas importantes a atacar es primeramente establecer la configuración de los datos, de los vectores acusticos y de los modelos en nuestro sistema. Porlo antes mencionado, los experimientos relizados en su primerea etapa estan orientados a determinar un rango de tamaño en el vector acustico MFCC con buenos resultados; igualmente es fundamental hacer lo mismo con las densidades gaussianas necesarias en un modelo GMM para obtener resultados razonables.
En una primera etapa utilizamos una base de datos que consiste de grabaciones de cada uno de los sonidos anormales pulmonares, pero debido a al arquitectura de nuestro sistema de reconocimiento, el cual esta diseñado para realizar el reconocimiento con un numero de archivos similares para todos los sonidos, solo utilizamos 4 grabaciones, ya que este era el numero máximo de grabaciones para los sonidos de Crepitaciones y estridor. Para la realización de las corridas de reconocimiento, utilizamos un numero constante de 10 vectores MFCC variando solo el numero de Gaussianas (GMM) de 10 a 16.

En una segunda ronda y partiendo de los resultados obtenidos de los primeros experimentos, nuestra preocupación consiste en hacer un analisis mas exhaustivo en cuanto al tamaño del vector MFCC, la cantidad de gaussianas necesarias asi como tambien determinar si nuestra base de datos cuenta son las grabaciones necesarias para obtener optimos resultados.

A diferencia de la primera etapa, para los experimentos realizados utilizamos un rango de 4 a 11 vectores MFCC y un rango de GMM desde 4 hasta 11, cabe mencionar que para esta etapa utilizamos todas las grabaciones de sonidos pulmonares anormales disponibles en nuestra base de datos, relizando varias corridas de la misma sesion para cada rango maximo de grabaciones.

Comments (0)