ANÁLISE DOS EFEITOS DE CODECS DE ÁUDIO NA AVALIAÇÃO DE DESVIOS VOCAIS

Cavalcante, Anselmo de Vasconcelos

Resumo

Este trabalho apresenta um estudo sobre as implicações no uso de diferentes codecs de áudio na análise perceptiva e acústica da voz. Um cenário de transmissão baseado em VoIP foi criado, empregando o Asterisk e o softphone Microsip, para auxiliar no diagnóstico de desvios vocais à distância. Para este propósito, foram utilizados 36 sinais de vozes sintetizadas e 36 sinais de vozes reais, classificados como normais, com o desvio rugosidade e com o desvio soprosidade. Cada sinal foi submetido a seis transmissões, cada uma delas utilizando um codec específico (G.711 Lei A, Speex32, GSM Full Rate, LPCM16, Opus24 e SILK16). Antes e após cada transmissão, um especialista em voz realizou a classificação dos sinais quanto ao tipo de desvio e, com auxílio do software VoxMetria, extraiu-se as medidas acústicas frequência fundamental, jitter, shimmer, GNE e desvio padrão da frequência fundamental. Observou-se que, dentre os codecs analisados, o Opus24 foi aquele se mostrou o mais promissor para avaliação da qualidade vocal, por ter sido o único a apresentar taxa de acurácia acima de 70%, tanto para os sinais sintetizados quanto para os sinais reais analisados. Este codec conseguiu manter os desvios vocais inalterados para avaliação em mais de 85% dos sinais reais.

Citação

Artigo Completo

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.