Um estudo sobre a aplicação do algoritmo Random Forest em problemas de classificação e regressão

Visualizar/ Abrir
Data
2024-12-17Autor
Pinto, Carlos Eduardo Ferreira
Orientador
Boff, Elisa
Metadata
Mostrar registro completoResumo
O Aprendizado de Máquina (AM) é uma subárea da Inteligência Artificial (IA) que possui duas abordagens, sendo elas o aprendizado supervisionado e não supervisionado. Dentro desses, ainda possuem mais ramos, como por exemplo a divisão do aprendizado supervisionado em problemas de classificação e regressão, os quais possuem algoritmos próprios para aplicação e solução dos problemas. Para que o AM ocorra, podemos citar diversos algoritmos de AM como as Artificial Neural Networks (ANN), o Random Forest (RF), os Support Vector Machine (SVM), o K-Nearest Neighbor (kNN), o Clustering, e diversos outros, onde cada um deles possui suas particularidades, modelo de construção e aplicação e são adequados para certos tipos de problemas, em função da proposta de aprendizado de cada um deles. Portanto, este trabalho propõe a realização de uma pesquisa sobre AM e alguns de seus algoritmos, dando ênfase no algoritmo de RF e realizar a aplicação dele em três datasets e analisar os resultados. O desenvolvimento foi feito na linguagem R e foi utilizada a biblioteca do Random Forest (RF) disponível. Três datasets foram previamente selecionados, sendo eles de mesmas área de aplicação, porém cada um com particularidades diferentes, visando a melhor adequação dos parâmetros das funções da biblioteca para cada um dos conjuntos de dados. Por fim, os resultados foram avaliados com base nas métricas de cálculo definidas previamente, baseando- se na parametrização feita para cada umas das execuções e que, ao fim da análise, obtiveram-se resultados eficazes e sastisfatórios. [resumo fornecido pelo autor]