ANÁLISE DA TÉCNICA DE IMPORTÂNCIA DE VARIÁVEIS POR PERMUTAÇÃO EM MODELOS DE CLASSIFICAÇÃO SUPERVISIONADA BASEADOS EM ÁRVORES

Conteúdo do artigo principal

Jane Piantoni
Kamila Cristina de Credo Assis

Resumo

Este estudo examina a aplicação da técnica de Importância de Variáveis por Permutação (PFI) em modelos de classificação supervisionada, com foco em algoritmos baseados em árvores de decisão, como o Random Forest. A PFI tem sido empregada devido à sua simplicidade e natureza agnóstica ao modelo, o que permite sua aplicação em diferentes arquiteturas preditivas. Este estudo aborda as limitações dessa técnica, como a geração de instâncias fora da distribuição original e a sensibilidade a variáveis correlacionadas. O conjunto de dados utilizado abrange características do solo e condições climáticas, e a importância das variáveis foi calculada utilizando a implementação da PFI pela biblioteca scikit-learn. Os resultados demonstram a eficácia da técnica na identificação das variáveis mais relevantes. Comparações com outras técnicas, como SHAP e LIME, são apresentadas, destacando suas vantagens e limitações no contexto da classificação supervisionada.

Detalhes do artigo

Seção
Artigos