Explicabilidade de algoritmos de classificação aplicados à detecção de anomalias em tubulações de gás e petróleo
Visualizar/ Abrir
Data
2025-08-04Autor
Susin, Lucas Pagnocelli
Orientador
Zerbetto Neto, Ângelo
Metadata
Mostrar registro completoResumo
A indústria de petróleo entende que prever anomalias em poços produtores pode contribuir para reduzir os custos de manutenção. Além de evitar perdas na produção, evita riscos de acidentes que possam afetar o meio ambiente e a segurança das pessoas. Assim como em diversos processos industriais, o sistema de extração e transporte de petróleo também está sujeito a diferentes tipos de anomalias. Para identificar a ocorrência destas anomalias durante a produção de petróleo, e desenvolver métodos que possibilitem diferenciar anomalias com impactos semelhantes na produção, este trabalho combina a utilização do algoritmo de classificação Random Forest com ferramentas de Inteligência Artificial Explicável (IAE). O algoritmo de classificação foi aplicado para identificar diferentes classes presentes em um banco de dados público, contendo dados reais de produção de diversos poços de petróleo. Para que seja possível compreender e confiar nos resultados obtidos pelo algoritmo, ferramentas de IAE foram utilizadas para desenvolver métodos que expliquem o funcionamento interno dos modelos de maneira clara e acessível. Isso pode incluir técnicas que ajudam a entender quais características ou dados influenciaram uma decisão, tornando o processo mais transparente. No presente trabalho foram selecionadas duas: SHAP e LIME. Ambas foram testadas e analisadas a partir de diversos critérios de avaliação. Posteriormente, estes critérios fizeram parte de uma avaliação realizada através do Método Analítico Hierárquico (MAH), para comparação das ferramentas escolhidas. Os resultados obtidos evidenciaram êxito na classificação de anomalias, com F1-Scores de 100%. A utilização das bibliotecas de IAE revelou que o algoritmo de classificação foi capaz de estabelecer conclusões em conformidade com princípios termodinâmicos. Ambas foram capazes de destacar a importância de cada variável na classificação de forma pertinente. Além disso, embora SHAP e LIME apresentem fundamentos distintos, suas explicações convergiram para a maioria dos casos. Por fim, em uma comparação formal via Método Analítico Hierárquico (MAH) indicou a superioridade da ferramenta SHAP para esta aplicação. [resumo fornecido pelo autor]