Predicting occupationa laccidents in Brazil: a machine learning based approach
Toledo, Jefferson de Morais
Resumo
Acidentes de trabalho representam um sério problema social no Brasil, muitas vezes causando mortes de trabalhadores ou incapacidade permanente para o trabalho. Portanto, é necessário estudar distribuição estatística desses acidentes no país e avaliar a possibilidade de prever a ocorrência desses fenômenos. Neste trabalho, obtemos um conjunto de dados unificado, que chamamos de BrStats, com dados estatísticos de todas as cidades brasileiras, integrando dados públicos relacionados à população, economia, educação e saúde. Em seguida, usamos o BrStats e adicionamos mais dados relacionados a acidentes de trabalho, inspeções trabalhistas e emprego para obter conjuntos de dados que são usados para treinar modelos de aprendizado de máquina (ML) para prever a ocorrência de acidentes de trabalho no Brasil. Primeiramente, prevemos o número de acidentes de trabalho em cada atividade econômica nos estados brasileiros treinando modelos de regressão linear, máquina de vetores de suporte (SVM), XGBoost e LightGBM. Neste cenário, obtemos valores de R2 próximos a 0,9. Prevemos, então, o número de acidentes de trabalho em cidades brasileiras usando regressão linear como baseline, além de algoritmos de árvores de decisão e gradient boosting (Gradient Boosting, LightGBM, XGBoost e CatBoost), com a adoção de otimização bayesiana para ajustar os hiperparâmetros dos algoritmos. Também usamos uma técnica de seleção de features baseada na importância das features para avaliar quais variáveis apresentam maior significância nas predições. Os modelos apresentam alto desempenho, com a métrica R-quadrado atingindo valores superiores a 0,90. Os resultados obtidos neste trabalho podem auxiliar o governo e as empresas a adotarem ações preventivas para evitar acidentes de trabalho, reduzindo os custos humanos e previdenciários do país.
Citação
Artigo Completo
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.