• português (Brasil)
    • English
    • español
    • italiano
    • Deutsch
  • Deutsch 
    • português (Brasil)
    • English
    • español
    • italiano
    • Deutsch
  • Einloggen
Dokumentanzeige 
  •   DSpace Startseite
  • Trabalhos de Conclusão de Curso
  • Área do Conhecimento das Ciências Exatas e da Terra
  • Ciência da Computação - Bacharelado
  • Dokumentanzeige
  •   DSpace Startseite
  • Trabalhos de Conclusão de Curso
  • Área do Conhecimento das Ciências Exatas e da Terra
  • Ciência da Computação - Bacharelado
  • Dokumentanzeige
JavaScript is disabled for your browser. Some features of this site may not work without it.

Visualização de dados em processos de Machine Learning

Thumbnail
Öffnen
TCC Felipe Fagundes Scalco.pdf (4.310Mb)
Datum
2021-07-23
Autor
Scalco, Felipe Fagundes
Orientador
Webber, Carine Geltrudes
Metadata
Zur Langanzeige
Zusammenfassung
Com o recente surgimento do Big Data a produção de dados sendo gerados diariamente nunca foi tão grande. E para que se possa extrair conhecimento desses dados o Machine Learning interpreta um papel fundamental, devido a sua capacidade de aprender com dados históricos. As técnicas de Machine Learning compreendem métodos orientados a dados que combinam conceitos fundamentais da ciência da computação com outros das áreas de estatística, probabilidade e otimização e tem como objetivo implementar algoritmos capazes de aprender, com pouca ou nenhuma necessidade de assistência ou intervenção humana. Tendo em vista a complexidade dos conjuntos de dados soma-se ao processo de Machine Learning componentes visuais. Os componentes visuais tem como objetivo representar visualmente as informações. Auxiliando desta maneira a interpretação dos dados, aproveitando o sistema visual dos seres humanos para reconhecer padrões. Além de oferecer diferentes maneiras de mostrar os resultados de uma forma mais amigável, ajudando na tomada de decisão. Para demonstrar a relevância da visualização de dados durante o processo de Machine Learning este trabalho desenvolve e avalia um processo de Machine Learning apoiado em ferramentas de visualização de dados. Utilizou-se como método o estudo de caso, por considerar-se que cada conjunto de dados deve ser tratado de maneira única, dadas as suas características e distribuições. As ferramentas de visualizações selecionadas foram as seguintes: Yellowbrick, Seaborn, Ploty, MatPlotLib. Neste trabalho, selecionou-se dois conjuntos de dados distintos. O primeiro conjunto de dados, contempla dados públicos que contém o número de casos de ocorrências de contaminados, recuperados e mortos pelo novo coronavírus em todos os continentes. Por meio deste conjunto explorou-se recursos de visualização de dados numéricos e categóricos, com mapas e gráficos mistos. Já o segundo conjunto de dados, amplamente utilizado em estudos na área, foi o conjunto de dados Iris. Este conjunto de dados é normalmente usado para avaliar algoritmos de classificação pois apresenta estrutura bem definida. Além disso, ele constitui um elemento importante para os estudos na área, pois seus dados apresentam características numéricas e categóricas (classes). Isso possibilita comparações, análises e visualizações que, uma vez compreendidas em cenário ilustrativo, podem ser replicadas em outros contextos complexos. Como resultados observados, destaca-se a importância das ferramentas de visualização no processo de Machine Learning, contribuindo para o entendimento e validação das suas etapas. Em especial, em conjuntos de dados com o Coronavirus recursos de análise do erro (médio, quadrático, etc) além de medidas estatísticas são as mais usadas. Já em conjuntos de dados com o Iris recursos de análise do precisão dos classificadores são mais relevantes. Para concluir, considera-se que os resultados foram satisfatórios e que as ferramentas de visualização, além de necessárias na tomada da decisão, auxiliam o ser humano no processo de exploração dos dados. [resumo fornecido pelo autor]
URI
https://repositorio.ucs.br/11338/9716
Collections
  • Ciência da Computação - Bacharelado [194]

DSpace software copyright © 2002-2016  DuraSpace
Kontakt | Feedback abschicken
Theme by 
Atmire NV
 

 

Stöbern

Gesamter BestandBereiche & SammlungenErscheinungsdatumAutorenTitelnSchlagwortenDiese SammlungErscheinungsdatumAutorenTitelnSchlagworten

Mein Benutzerkonto

EinloggenRegistrieren

DSpace software copyright © 2002-2016  DuraSpace
Kontakt | Feedback abschicken
Theme by 
Atmire NV