Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas
Visualizar/ Abrir
Data
2014-06-17Autor
Notari, Daniel Luís
Orientador
Bonatto, Diego
Metadata
Mostrar registro completoResumo
Workflows científicos são projetados para realizar experimentos in silico com o
intuito de processar e analisar uma grande quantidade de dados usando simulação
computacional. Os experimentos são organizados como uma sequência de etapas que
caracterizam um fluxo de execução, onde em cada etapa utilizam-se diferentes
softwares. Estes softwares não possuem um modelo de representação de dados comum.
Por isto, quando um workflow científico é construído com o objetivo de integrar e
processar dados, cada etapa precisa analisar a estrutura dos dados, processá-los e
preparar os mesmos de acordo com a estrutura necessária para a execução da próxima
etapa do workflow. Desta maneira, os workflows científicos usam diferentes algoritmos
provenientes das áreas da matemática e da ciência da computação, os quais são capazes
de processar, armazenar e transformar os dados utilizados em informação útil para
diferentes análises de pesquisadores de biologia. Adicionalmente, a biologia de sistemas
é uma subárea da bioinformática que ajuda a compreender as interações observadas
entre populações de moléculas, células e organismos resultantes do aumento da
complexidade biológica. Assim, nesta tese de doutorado, buscou-se desenvolver
workflows científicos utilizando-se ferramentas de bioinformática e biologia de sistemas
para comparar processos biológicos através da geração de redes de interação proteínaproteína.
Para tanto, o programa Dis2PPI foi gerado por meio de um workflow científico
que possibilitou integrar os bancos de dados de doenças monogênicas OMIM (Online
Mendelian Inheritance in Man) com o programa de metabuscas STRING (Search Tool
for the Retrieval of Interacting Genes/Proteins). O objetivo desta integração foi gerar
uma rede de interação proteína-proteína associada com doenças de natureza
monogênica. Como prova de conceito, o programa Dis2PPI foi utilizado para a
obtenção de redes de interação para as síndromes xeroderma pigmentosa e de Cockayne, duas doenças monogênicas raras e cujos fenótipos estão associados com
acúmulos de danos de DNA, câncer, progeria e neurodegeneração. Uma vez geradas,
estas redes foram avaliadas com o uso ferramentas de biologia de sistemas para análise
de ontologia gênica e de centralidade no programa Cytoscape. Da mesma forma, o
programa Net2Homology foi gerado através de um desenho de um workflow científico
que possibilitasse integrar o resultado de um alinhamento de sequências de proteínas,
usando o programa NCBI PSI-BLAST, com o programa de metabuscas STRING. Neste
sentido, o programa Net2Homology possibilitou recuperar duas redes de interação
proteína-proteína associada a dois organismos diferentes. Este mesmo programa foi
utilizado para a obtenção de redes de interação para a doença xeroderma pigmentosa e
para a enzima ciclo-oxigenase-1 cruzando as informações dos organismos Homo
sapiens e Mus musculus. As redes de interação obtidas foram comparadas visando obter
os processos biológicos evolutivamente conservados.