Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade

Carregando...
Imagem de Miniatura

Data de Submissão

Data de Defesa

2015-04-27

Edição

Coorientadores

Editores

Título da Revista

ISSN da Revista

Título de Volume

Editor

Descrição

As sequências genômicas carregam uma ampla gama de informações sobre os organismos que a compõem. Obviamente, devido à grande semelhança destas informações e funções, espera-se que uma determinada sequência possa pertencer a muitos organismos, com probabilidades semelhantes. Entretanto, cada genoma carrega dentro de si certas peculiaridades que podem ser extraídas utilizando as ferramentas adequadas. Neste contexto, este trabalho propõe um processo de análise de sequências genômicas de bactérias, utilizando algumas medidas que são particularmente importantes: a entropia de triples (Sn), a quantificação da periodicidade 3 (P3) em uma sequência, o coeficiente de clusterização (D) e o percentual de GC. O processo aqui proposto nos permite inferir a qual organismo uma determinada sequência genômica pode pertencer, mostrando-se viável a sua utilização em metagenômica. Os resultados neste trabalho demonstram a eficácia deste método. Foram identificados 100% dos organismos presentes nas amostras estudadas (VP). Por outro lado, foi encontrado um grande número de organismos não pertencentes às amostras (FP), o que indica a grande similaridade de determinadas sequências, corroborando com alguns estudos que indicam que o genoma carrega consigo sequências órtologas, comuns a inúmeros organismos.

Resumo

Genomic sequences carry a wide range of information on organism that compose it. Obviously, by reason that great similarity of this information and functions, it is expected that each sequence can belong to many organisms with a similar probability. However, each genome carries within itself certain peculiarities that can be extracted using appropriate tools. In this context , this paper proposes a methodology for the analysis of genomic sequences of bacteria , using some measures that are particularly important : The entropy of triples ( Sn ) , the quantification of frequency 3 (P3) in a sequence , the clustering coefficient ( D ) and the percentage of GC . The method proposed here allows us to infer which a particular organism genome sequence may belong, being feasible for use in Metagenomics. The results of this study demonstrate the effectiveness of this method, 100 % of the organisms were identified in the samples studied (VP). On the other hand, a large number of bodies which did not belong samples were found (FP), which indicates the high similarity of certain sequences, corroborating some studies indicate that the genome carries ortholog sequences, common to countless organisms.

Citação

Avaliação

Revisão

Suplementado Por

Referenciado Por

Campus-Sede

Rua Francisco Getúlio Vargas, 1130
CEP 95070-560 - Caxias do Sul

Todos os campi - Como chegar

Central de Atendimento

Youtube

© 2001-2025 Universidade de Caxias do Sul. Todos os direitos reservados

Youtube