Classificação de patologias laríngeas baseada em gráficos de recorrência e redes neurais convolucionais
Barros, Luana Rodrigues
Resumo
A laringe é uma das principais estruturas do sistema fonatório humano e pode ser afetada por patologias que ocasionam alterações nas características intrínsecas da voz do locutor. Com isso, a análise acústica tem se destacado como uma ferramenta na detecção de patologias laríngeas. Nesse contexto, os sinais de voz podem ser modelados como gráficos de recorrência (RPs), que permitem a análise de recorrências em forma de matrizes bidimensionais. Contudo, até o presente momento apenas RPs binários foram aplicados com essa finalidade. Este estudo apresenta sinais de vozes saudáveis e patológicas modelados como quatro tipos de RPs: RP binário, RP sem limiar (URP - Unthresholded Recurrence Plot), o ReLU-RP (Rectified Linear Unit based Recurrence Plot) e o RP do espectro da frequência (FFT-RP - Fast Fourier Transform Recurrence Plot). Foi definida uma rede neural convolucional (CNN - Convolutional Neural Network) para realizar a classificação individual dos quatro tipos de RPs. Foi utilizado o método de cross-validation (k = 4) para treinamento e avaliação de desempenho das CNNs. Os melhores resultados de classificação do sinal de áudio completo foram obtidos para o gráfico de recorrência do tipo ReLU-RP (ε = 0, 3), considerando métricas de acurácia, precisão, sensibilidade, especificidade e F1-score.
Citação
Artigo Completo
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.