Dissertação
ANÁLISE DINÂMICA NÃO LINEAR E ANÁLISE DE QUANTIFICAÇÃO DE RECORRÊNCIA APLICADAS NA CLASSIFICAÇÃO DE DESVIOS VOCAIS
Disfonia representa qualquer dificuldade na emissão vocal que prejudique a produção
natural da voz. Técnicas de processamento digital de sinais vêm sendo empregadas
como ferramenta auxiliar na avaliação de desvios vocais, trazendo maior conforto ao
paciente. Algumas medidas não lineares, baseadas na teoria do caos, foram empregadas,neste trabalho, em conjunto com medidas de quantificação de recorrência para a análise discriminativa destes desvios. Dois estudos de caso foram realizados nesta pesquisa. No caso 1 foi feita a discriminação de vozes adultas saudáveis e desviadas (rugosidade, soprosidade e tensão) e no caso 2 foi avaliada a discriminação da intensidade dos graus dos desvios vocais de vozes adultas (Grau 1-voz normal, Grau 2 - voz considerada com desvio leve e Grau 3 - voz considerada com desvio moderado). As características da análise dinâmica não linear empregada no processo de classificação foram a Dimensão de Correlação e o Primeiro Mínimo da Função de Informação Mútua. As medidas de quantificação empregadas foram o Determinismo, a Entropia de Shannon, o Comprimento Médio das Linhas Diagonais, o Comprimento Máximo das Linhas Verticais e a Transitividade. O Passo de Reconstrução também foi utilizado no processo de classificação. Por meio dos testes estatísticos, foi avaliado o potencial de cada característica em discriminar os tipos de sinais de voz considerados. Foi utilizada a rede neural MLP (Multilayer Perceptron), com o algoritmo de aprendizado supervisionado Gradiente Conjugado Escalonado (SCG), no processo de classificação. Avaliando o desempenho do classificador utilizando as medidas, de forma individual e combinada, foram obtidos, como melhores resultados, uma acurácia média de 91,17% na distinção entre as vozes saudáveis e soprosas com as medidas Transitividade e Passo de reconstrução. Com relação à discriminação entre a intensidade dos graus dos desvios, obteve-se uma acurácia média de 94,5% entre os Graus 1 e 3, com a combinação das medidas Determinismo, Entropia, Transitividade, Primeiro Mínimo da Função de Informação Mútua e o Comprimento máximo das linhas verticais. Os resultados encontrados, nesta pesquisa, indicam que as medidas não lineares, baseadas na teoria do caos, com as medidas de quantificação de recorrência foram eficientes para detectar a presença e o grau dos desvios vocais, podendo ser empregada em métodos de avaliação, triagem e monitoramento vocal.