Avaliação da qualidade da informação na área da saúde: aplicação de algoritmos de aprendizado de máquina
Fecha
2018-05-29Autor
Silva, Caio Gustavo Rodrigues da
Orientador
Webber, Carine Geltrudes
Metadatos
Mostrar el registro completo del ítemResumen
A evolução contínua das tecnologias de informação proporciona às pessoas e aos pacientes um acesso cada vez mais fácil e instantâneo a artigos, receitas e dicas relacionadas à saúde e às condições de vida. Frente a isso, a necessidade de revisão e garantia da qualidade destas informações existentes na Internet é de grande importância, uma vez que decisões baseadas em informações equivocadas podem provocar consequências graves e permanentes ao usuário/paciente. O conceito de análise textual automática é derivado dos estudos baseados em Mineração de Textos, podendo ser caracterizado pela descoberta e extração de padrões relevantes e informações úteis a partir de elementos textuais. O objetivo principal deste trabalho é aplicação de técnicas e conceitos relacionados à Mineração de Textos em uma ferramenta Web, com o propósito de se automatizar e alcançar resultados semelhantes aos de especialistas humanos no processo de classificação de textos da área da saúde. Para alcançar o objetivo proposto foram estudados algoritmos de aprendizagem de máquina (J48, Naïve Bayes, Support Vector Machines, K-Nearest Neighbor) que fizeram parte de estudos recentes ligados a saúde em outros idiomas, a fim de utilizá-los como base para testes e para o desenvolvimento da ferramenta. Complementando estes estudos, examinou-se os benefícios proporcionados pela aplicação da estrutura de um Ensemble de algoritmos de aprendizado de máquinas. Após a realização destes estudos, coletou-se junto a especialistas humanos amostras de dados textual. Estas amostras foram divididas em categorias, que segundo os especialistas, são determinantes para a classificação final de um texto da área da saúde, sendo assim os arquivos foram divididos entre: Descrição do tratamento, Benefícios do tratamento, Consequências do tratamento, Influência na qualidade de vida do paciente, Riscos do tratamento. A fim de se assemelhar às percepções dos especialistas, foi implementado na ferramenta Web um Ensemble de algoritmos. Cada algoritmo do Ensemble representa uma das categorias definidas pelos especialistas. Após esta implementação, foi possível realizar os testes utilizando as amostras selecionadas. Após a realização dos testes, os algoritmos que obtiveram os melhores resultados foram utilizados na versão final da ferramenta. Com a utilização destes algoritmos foi possível obter uma taxa de 90,75% de convergência entre as classificações realizadas pela ferramenta e as classificações realizadas pelos especialistas. Como conclusão, considera-se que os resultados são promissores e evidenciam a viabilidade de uso de técnicas de aprendizado automático no tratamento de textos da área da saúde (sic).