Dissertação
Avaliação de Distúrbios da Voz por meio de Análise de Quantificação de Recorrência
Distúrbios da voz podem atingir diferentes faixas etárias, afetando a qualidade vocal,
prejudicando a comunicação por meio da voz. Técnicas de processamento digital de sinais de voz
podem ser empregadas para auxiliar outros métodos de avaliação de distúrbios da voz, tais como
análise otorrinolaringológica e análise perceptivo-auditiva. A análise de quantificação de recorrência é
uma técnica não linear de análise de séries temporais, empregada neste trabalho, para a avaliação
de distúrbios da voz. As características não lineares inerentes ao sistema de produção da fala são
representadas pelas estruturas dos gráficos de recorrência, que se modificam de acordo com o grau do
desvio vocal ou pela presença de patologia laríngea. Nesta pesquisa, distúrbios da voz são analisados
e classificados considerando-se duas abordagens: 1) Análise de sinais de vozes de locutores afetados
por patologias laríngeas; e 2) análise de sinais de vozes infantis diagnosticadas de acordo com o grau
de intensidade do desvio vocal. As medidas de quantificação de recorrência foram extraídas com e sem
segmentação, de acordo com taxas de recorrência em patamares de 1% a 5%. As medidas empregadas
na análise sem segmentação foram: determinismo (DET), comprimento máximo das linhas diagonais
(Lmax ), entropia de Shannon (ENTR), tendência (TREND), laminaridade (LAM), tempo de permanência
(T T) e comprimento máximo das linhas verticais (Vmax ). Na análise dos sinais segmentados foram
acrescentadas as medidas: transitividade (TRANS), relação entre determinismo e taxa de recorrência
(RAT IO), divergência (DIV), comprimento médio das linhas diagonais (Lmed ), tempo de recorrência do
tipo 1 (T1), tempo de recorrência do tipo 2 (T2), entropia do tempo de recorrência do tipo 1 (RPDE) e
o raio de vizinhança (RAIO). O objetivo é identificar a melhor medida ou a combinação mais eficiente,
o patamar de taxa de recorrência ideal e o tipo de processamento (com ou sem segmentação) para
os quais se obtém uma maior discriminação entre as classes envolvidas. Na separação entre vozes
saudáveis e vozes patológicas, a medida Lmax foi a mais eficiente, com taxa de recorrência de 2% e análise
discriminante quadrática (QDA) na classificação. Isto indica que a formação de estruturas diagonais nos
gráficos de recorrência é um fator importante de discriminação, estando mais presente em sinais de vozes
saudáveis. Na classificação com redes neurais artificiais e medidas extraídas com segmentação, a acurácia
máxima foi 99,11% 0,90%, discriminando vozes saudáveis de vozes afetadas por nódulos, com as 15
medidas combinadas e taxa de recorrência até 1%. Na avaliação dos desvios vocais das vozes infantis, na
discriminação entre vozes saudáveis e vozes alteradas, a maior acurácia foi de 88,22% 0,93%, com 8
medidas combinadas, extraídas sem segmentação, e taxa de recorrência de 4%. Na discriminação entre
o grau geral leve e o grau geral moderado, obteve-se uma acurácia de 88,47% 3,71%, com taxa de
recorrência de 5%, combinando 7 medidas. A medida Lmax se destacou na discriminação entre vozes
saudáveis e alteradas. Na discriminação entre os desvios leve e moderado, as medidas T T e DET foram
determinantes na detecção do grau do desvio vocal. A formação de estruturas verticais nos gráficos de
recorrência, relacionada com o comportamento caótico do sinal, representada por T T, se mostrou mais
presente em sinais de vozes com maior desvio vocal, enquanto que a formação de estruturas diagonais
é mais presente em vozes com desvio mais leve a saudável. Os resultados encontrados, nesta pesquisa,
indicam que a análise de quantificação de recorrência é eficiente em detectar a presença e o grau de
distúrbios vocais, podendo ser empregada em métodos de avaliação, triagem e monitoramento vocal.