Um estudo sobre a aplicação do algoritmo Random Forest em problemas de classificação e regressão

Pinto, Carlos Eduardo Ferreira

Um estudo sobre a aplicação do algoritmo Random Forest em problemas de classificação e regressão

Arquivos

TCC Carlos Eduardo Ferreira Pinto.pdf (1.82 MB)

Data de Submissão

2024-12-17

Data de Defesa

2024-11-27

Autores

Pinto, Carlos Eduardo Ferreira

Orientadores

Boff, Elisa

Descrição

O Aprendizado de Máquina (AM) é uma subárea da Inteligência Artificial (IA) que possui duas abordagens, sendo elas o aprendizado supervisionado e não supervisionado. Dentro desses, ainda possuem mais ramos, como por exemplo a divisão do aprendizado supervisionado em problemas de classificação e regressão, os quais possuem algoritmos próprios para aplicação e solução dos problemas. Para que o AM ocorra, podemos citar diversos algoritmos de AM como as Artificial Neural Networks (ANN), o Random Forest (RF), os Support Vector Machine (SVM), o K-Nearest Neighbor (kNN), o Clustering, e diversos outros, onde cada um deles possui suas particularidades, modelo de construção e aplicação e são adequados para certos tipos de problemas, em função da proposta de aprendizado de cada um deles. Portanto, este trabalho propõe a realização de uma pesquisa sobre AM e alguns de seus algoritmos, dando ênfase no algoritmo de RF e realizar a aplicação dele em três datasets e analisar os resultados. O desenvolvimento foi feito na linguagem R e foi utilizada a biblioteca do Random Forest (RF) disponível. Três datasets foram previamente selecionados, sendo eles de mesmas área de aplicação, porém cada um com particularidades diferentes, visando a melhor adequação dos parâmetros das funções da biblioteca para cada um dos conjuntos de dados. Por fim, os resultados foram avaliados com base nas métricas de cálculo definidas previamente, baseando- se na parametrização feita para cada umas das execuções e que, ao fim da análise, obtiveram-se resultados eficazes e sastisfatórios. [resumo fornecido pelo autor]

Resumo

Machine Learning (ML) is a subfield of Artificial Intelligence (AI) that encompasses two main approaches: supervised learning and unsupervised learning. Within these, there are further sub- divisions, such as the division of supervised learning into classification and regression problems, each of which has its own specific algorithms for application and problem-solving. To facilitate ML, various algorithms can be cited, such as ANNs, RF, SVM, kNN, clustering, and many others. Each algorithm has unique characteristics, construction models, and applications, mak- ing them suitable for specific types of problems based on their learning framework. This study aims to conduct research on ML and some of its algorithms, with a particular focus on the RF algorithm, applying it to three datasets and analyzing the results. The development was carried out in R, using the Random Forest library (RF) available. Three datasets were pre-selected, all belonging to the same application domain but with distinct particularities, aiming to better tailor the function parameters of the library to each dataset. Finally, the results were evaluated based on predefined calculation metrics, considering the parameterization used for each execution. The analysis yielded effective and satisfactory results. [resumo fornecido pelo autor]

Palavras-chave

Aprendizado do computador, Algorítmos computacionais, Ordenação (Computadores), Computação

URI

https://repositorio.ucs.br/11338/14560

Coleções

Ciência da Computação - Bacharelado

Página do item completo

Um estudo sobre a aplicação do algoritmo Random Forest em problemas de classificação e regressão

Arquivos

Data de Submissão

Data de Defesa

Edição

Autores

Orientadores

Coorientadores

Editores

Título da Revista

ISSN da Revista

Título de Volume

Editor

Descrição

Resumo

Palavras-chave

Citação

URI

Coleções

Avaliação

Revisão

Suplementado Por

Referenciado Por