Clusterização aplicada na análise genômica
Visualizar/ Abrir
Autor
Basso, Thiago Ângelo
Orientador
Faccin, Daniel Antônio
Metadata
Mostrar registro completoResumo
A necessidade pelo desenvolvimento de metodologias computacionais que auxiliem na análise dos dados de origem biológica cresce constantemente. A bioinformática é área de conhecimento onde ferramentas dos campos da computação e matemática são aplicadas na geração e manipulação de informações biológicas. Um esforço muito grande vem sendo realizado nesta área, especialmente na análise genômica, desde a década de 90, quando grandes projetos foram iniciados com o objetivo de sequenciar o DNA dos organismos vivos conhecidos. Neste trabalho são analisadas sequências do DNA da bactéria E.coli. Os dados são obtidos de uma base de dados pública e são submetidos a aplicação de uma técnica de mineração de dados, a clusterização. O foco está na etapa de seleção e extração de atributos, onde diferentes abordagens são aplicadas a fim de reduzir a quantidade de ruídos e informações irrelevantes contidas nas amostras e aprimorar a análise da região promotora da expressão gênica, bem como a identificação de padrões expressos na mesma (sic).