Workflow científico de anotação genômica funcional e curadoria manual de genomas
Datum
2021-04-07Autor
Balbinot, Eduardo
Orientador
Dillon, Aldo José Pinheiro
Metadata
Zur LanganzeigeZusammenfassung
Com o advento das tecnologias de sequenciamento de nova geração, o sequenciamento de genomas não se apresentou mais como uma barreira tecnológica. Analisar a estrutura e atribuir um significado biológico para sequências genômicas e proteômicas in silico (anotação genômica), no entanto, se tornou a nova tarefa desafiadora. A anotação funcional é uma etapa crucial neste processo e tem por intuito compreender os processos biológicos dos organismos e guiar novas pesquisas. Entretanto, trata-se de uma tarefa complexa, já que envolve a utilização de um grande número de bancos de dados, web servers e ferramentas para realizar comparações das sequências de interesse com outras sequências disponíveis em repositórios de domínios de proteínas. Cada ferramenta possui arquivos de saída independentes e em formatos específicos, dificultando a organização dos resultados de anotação em um único contexto e o trabalho colaborativo de múltiplos pesquisadores em um mesmo projeto. O objetivo desta pesquisa compreendeu o desenvolvimento de um workflow científico de anotação genômica funcional e curadoria manual de genomas, através da implementação de uma ferramenta web colaborativa que permite a
execução automática de ferramentas de anotação funcional e integração dos resultados em uma plataforma unificada. A solução ainda permite a realização de curadoria manual de informações estruturais e funcionais para cada gene, além de suportar a exportação dos dados de anotação para os formatos exigidos no processo de submissão do banco de dados GenBank. O worflow foi testado e validado no processo de anotação genômica das linhagens selvagem (2HH) e mutante (S1M29) do fungo Penicillium echinulatum, conduzido pelo Laboratório de Bioinformática e Biologia Computacional da Universidade de Caxias do Sul e submetido ao GenBank através dos BioProjects PRJNA520890 e PRJNA521489, respectivamente. Além disso, uma versão experimental da ferramenta foi disponibilizada gratuitamente através do endereço https://seq2annot.org. A solução mostrou-se eficiente em função de abstrair a complexidade de execução de ferramentas externas e integrar os resultados de anotação em um ambiente colaborativo unificado. O mecanismo central de tarefas assíncronas permitiu a possibilidade de escalar horizontalmente os recursos de servidor à medida que ocorrer o aumento da demanda de trabalho. A decisão arquitetural de dividir trabalhos em pequenas unidades de trabalho independentes também garantiu que novas ferramentas de anotação funcional possam ser facilmente desenvolvidas e acopladas à aplicação, tornando-a uma solução promissora para ser constantemente aprimorada e utilizada em projetos de anotação genômica em larga escala no futuro. [resumo fornecido pelo autor]