ANÁLISE DA TÉCNICA DE IMPORTÂNCIA DE VARIÁVEIS POR PERMUTAÇÃO EM MODELOS DE CLASSIFICAÇÃO SUPERVISIONADA BASEADOS EM ÁRVORES
Conteúdo do artigo principal
Resumo
Este estudo examina a aplicação da técnica de Importância de Variáveis por Permutação (PFI) em modelos de classificação supervisionada, com foco em algoritmos baseados em árvores de decisão, como o Random Forest. A PFI tem sido empregada devido à sua simplicidade e natureza agnóstica ao modelo, o que permite sua aplicação em diferentes arquiteturas preditivas. Este estudo aborda as limitações dessa técnica, como a geração de instâncias fora da distribuição original e a sensibilidade a variáveis correlacionadas. O conjunto de dados utilizado abrange características do solo e condições climáticas, e a importância das variáveis foi calculada utilizando a implementação da PFI pela biblioteca scikit-learn. Os resultados demonstram a eficácia da técnica na identificação das variáveis mais relevantes. Comparações com outras técnicas, como SHAP e LIME, são apresentadas, destacando suas vantagens e limitações no contexto da classificação supervisionada.
Detalhes do artigo

Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial 4.0 International License.