Avaliação de Distúrbios da Voz por meio de Análise de Quantificação de Recorrência

Vieira, Vinícius Jefferson Dias

Resumo

Distúrbios da voz podem atingir diferentes faixas etárias, afetando a qualidade vocal, prejudicando a comunicação por meio da voz. Técnicas de processamento digital de sinais de voz podem ser empregadas para auxiliar outros métodos de avaliação de distúrbios da voz, tais como análise otorrinolaringológica e análise perceptivo-auditiva. A análise de quantificação de recorrência é uma técnica não linear de análise de séries temporais, empregada neste trabalho, para a avaliação de distúrbios da voz. As características não lineares inerentes ao sistema de produção da fala são representadas pelas estruturas dos gráficos de recorrência, que se modificam de acordo com o grau do desvio vocal ou pela presença de patologia laríngea. Nesta pesquisa, distúrbios da voz são analisados e classificados considerando-se duas abordagens: 1) Análise de sinais de vozes de locutores afetados por patologias laríngeas; e 2) análise de sinais de vozes infantis diagnosticadas de acordo com o grau de intensidade do desvio vocal. As medidas de quantificação de recorrência foram extraídas com e sem segmentação, de acordo com taxas de recorrência em patamares de 1% a 5%. As medidas empregadas na análise sem segmentação foram: determinismo (DET), comprimento máximo das linhas diagonais (Lmax ), entropia de Shannon (ENTR), tendência (TREND), laminaridade (LAM), tempo de permanência (T T) e comprimento máximo das linhas verticais (Vmax ). Na análise dos sinais segmentados foram acrescentadas as medidas: transitividade (TRANS), relação entre determinismo e taxa de recorrência (RAT IO), divergência (DIV), comprimento médio das linhas diagonais (Lmed ), tempo de recorrência do tipo 1 (T1), tempo de recorrência do tipo 2 (T2), entropia do tempo de recorrência do tipo 1 (RPDE) e o raio de vizinhança (RAIO). O objetivo é identificar a melhor medida ou a combinação mais eficiente, o patamar de taxa de recorrência ideal e o tipo de processamento (com ou sem segmentação) para os quais se obtém uma maior discriminação entre as classes envolvidas. Na separação entre vozes saudáveis e vozes patológicas, a medida Lmax foi a mais eficiente, com taxa de recorrência de 2% e análise discriminante quadrática (QDA) na classificação. Isto indica que a formação de estruturas diagonais nos gráficos de recorrência é um fator importante de discriminação, estando mais presente em sinais de vozes saudáveis. Na classificação com redes neurais artificiais e medidas extraídas com segmentação, a acurácia máxima foi 99,11% 0,90%, discriminando vozes saudáveis de vozes afetadas por nódulos, com as 15 medidas combinadas e taxa de recorrência até 1%. Na avaliação dos desvios vocais das vozes infantis, na discriminação entre vozes saudáveis e vozes alteradas, a maior acurácia foi de 88,22% 0,93%, com 8 medidas combinadas, extraídas sem segmentação, e taxa de recorrência de 4%. Na discriminação entre o grau geral leve e o grau geral moderado, obteve-se uma acurácia de 88,47% 3,71%, com taxa de recorrência de 5%, combinando 7 medidas. A medida Lmax se destacou na discriminação entre vozes saudáveis e alteradas. Na discriminação entre os desvios leve e moderado, as medidas T T e DET foram determinantes na detecção do grau do desvio vocal. A formação de estruturas verticais nos gráficos de recorrência, relacionada com o comportamento caótico do sinal, representada por T T, se mostrou mais presente em sinais de vozes com maior desvio vocal, enquanto que a formação de estruturas diagonais é mais presente em vozes com desvio mais leve a saudável. Os resultados encontrados, nesta pesquisa, indicam que a análise de quantificação de recorrência é eficiente em detectar a presença e o grau de distúrbios vocais, podendo ser empregada em métodos de avaliação, triagem e monitoramento vocal.

Citação

Artigo Completo

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.