Identificação da área representativa da retinopatia diabética com redes neurais convolucionais

Ribeiro, Felipe Regis Gouveia

Resumo

A retinopatia diabética é uma das principais causas de cegueira e sua detecção é uma tarefa complexa que demanda tempo e experiência do profissional, podendo divergir o prognóstico a depender dos examinadores que efetuem a avaliação. Neste trabalho, objetivando auxiliar na graduação e marcação da patologia, é proposto um script em Python baseado em técnicas de redes neurais convolucionais (CNN), com preocupação em preservar as características geométricas das imagens, avaliando os resultados de forma objetiva e subjetiva. A tarefa de graduação se trata de uma avaliação estritamente objetiva e se dá por meio das métricas de acurácia, área sob a curva, revocação e precisão. Na análise subjetiva, é realizada comparação da saída gráfica do código com imagens disponíveis em base de dados marcadas por quatro diferentes especialistas. Uma análise objetiva também é proposta para a avaliação das marcações por meio da acurácia e de nova métrica aqui proposta. Para estas tarefas, são exploradas diferentes arquiteturas de CNN, como Densenet121, Resnet50 e Xception, buscando realizar a extração de características das imagens provenientes da fundoscopia. A etapa de classificação é realizada por meio da inserção das características vindas da CNN em uma rede densa de múltiplas camadas cognitivas (MLP), que irá classificar a imagem em um dos cinco graus da doença, incluindo sua ausência. Técnicas de busca aleatória e otimização da etapa MLP do modelo foram empregadas com intuito de melhorar os resultados, bem como a rede foi treinada com um ajuste fino, diminuindo as camadas ativas e alterando a taxa de aprendizagem. Suportando a generalização do modelo de aprendizagem de máquina, foram realizadas operações de aumento de dados, onde foram geradas imagens com espelhamento horizontal, alteração da posição, proximidade da imagem, brilho e também da cor. Como resultados, foi obtida uma área sob a curva, no melhor caso, de aproximadamente 91%, enquanto que a grafia da área patológica se assemelha a marcações realizadas por médicos oftalmologistas com uma acurácia dos pixels superior a 83% para a imagem analisada, também no melhor caso.

Citação

Artigo Completo

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.