Integração de Dados no Contexto de Acidentes de Trânsito: fundamentos e avaliação de algoritmos de clusterização no apoio à resolução de entidades

Santiago, Maria
Fernandes, Damires

Resumo

Em ambientes de compartilhamento de dados, muitas aplicações podem requisitar acesso integrado a diversas fontes de dados que são autônomas e heterogêneas. A Integração de Dados é realizada em etapas, sendo uma delas a Resolução de Entidades. Nesse panorama, este relatório apresenta os resultados obtidos em um estudo que utilizou métodos de clusterização aplicados ao problema de Resolução de Entidades no contexto de dados de acidentes de trânsito. Na avaliação realizada, foi aplicado um processo de extração, transformação e carga dos dados juntamente com a tarefa de clusterização, focados na Resolução de Entidades. Os algoritmos avaliados foram o K- Means e o K-Medoids. A análise preliminar dos resultados da aplicação dos algoritmos ao problema em questão indica que o K-Means apresentou resultados ligeiramente melhores que o K-Medoids, em relação à quantidade de instâncias corretamente identificadas, de acordo com avaliação dos Especialistas do Domínio.

Citação

Artigo Completo

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.