Sumarização automática de textos: desafios e avanços em técnicas de processamento de linguagem natural

Silva, Micael Marques Rodrigues

Brasil Acesso à informação Participe Serviços Legislação Canais

Sumarização automática de textos: desafios e avanços em técnicas de processamento de linguagem natural

Silva, Micael Marques Rodrigues

Resumo

Neste trabalho, explorou-se a área de sumarização automática de texto, um campo em constante evolução com desafios significativos a superar. O principal foco do estudo foi a comparação do desempenho de seis algoritmos de sumarização automática de textos, a fim de identificar o mais eficaz. Dentre as principais contribuições deste trabalho, destacam-se: a análise comparativa de seis algoritmos de sumarização automática – Algoritmo de Luhn, GistSumm, ChatGPT, Algoritmo de Programação Linear Inteira, Algoritmo de Regressão Bayesiana e Algoritmo de Marques – em um texto sobre a COVID-19 e seus impactos; a implementação de uma metodologia de avaliação pautada em métricas de qualidade da sumarização; e a realização de um estudo com usuários para avaliar a utilidade e relevância dos resumos gerados. Os resultados obtidos indicam que o Algoritmo de Marques superou os demais algoritmos em até 20% em métricas como precisão, coerência, coesão e tempo de processamento. Isso sinaliza que a aplicação do Algoritmo de Marques na sumarização de textos pode ser promissora. Ainda assim, enfatiza-se que a área de sumarização automática de texto enfrenta desafios significativos, tais como a adaptação a diferentes tipos de textos e domínios de conhecimento, a avaliação rigorosa e consistente dos resumos gerados e a geração de resumos personalizados para atender às necessidades específicas dos usuários.

Citação

Artigo Completo

PDF File

Download do PDF

Imprimir artigo

Exibir Metadados