Redes neurais artificiais aplicadas no reconhecimento de regiões promotoras em bactérias Gram-negativas
Datum
2014-06-17Autor
Silva, Scheila de Avila e
Orientador
Echeverrigaray, Sérgio
Gerhardt, Günther Johannes Lewczuk
Metadata
Zur LanganzeigeZusammenfassung
A região promotora é uma sequência de DNA localizada anteriormente à uma
região codificante e é responsável por iniciar o processo de transcrição. Deste modo,
atua como um elemento regulador. O estudo da regulação da expressão gênica
auxilia na compreensão da maquinária vital dos seres vivos, no conhecimento sobre
a funcionalidade dos genes em diferentes espécies, na resposta celular frente às
mudanças ambientais, entre outras questões. Embora os métodos computacionais
para a predição de genes possuam uma boa acurácia o mesmo não é conseguido
para os promotores. Esta dificuldade se deve ao tamanho reduzido do promotor e ao
padrão pouco conservado, o que gera resultados com alto número de falsos
positivos. Esta tese teve como objetivo a utilização de Redes Neurais Artificiais na
predição, caracterização e reconhecimento de promotores de bactérias Gramnegativas.
Diferente de outros trabalhos, a predição realizada não foi limitada
apenas aos promotores dos genes constitutivos; foi realizada também para as
demais classes de sequências promotoras. Além da abordagem clássica utilizando a
composição de nucleotídeos foram empregados os valores de estabilidade da
sequência. De modo a otimizar o aprendizado da Rede Neural e implementar uma
ferramenta própria para a predição de promotores, foram extraídas regras de
inferência (baseadas no conhecimento produzido durante o treinamento da rede)
que foram ponderadas e implementadas em uma nova ferramenta, chamada BacPP.
Até o presente, os resultados obtidos com o BacPP foram satisfatórios e
comparáveis com a literatura. Os valores de exatidão obtidos com o BacPP para os
fatores σ24, σ28, σ32, σ38, σ54 e σ70 de E. coli foram, 86,9%; 92,8%; 91,5%; 89,3%;
97,0%; 83,6%, respectivamente. Quando a ferramenta foi aplicada em promotores
pertencentes a outras bactérias Gram-negativas, a exatidão geral foi de 76%.
Considerando a importância da predição de promotores e a ausência de banco de
dados com informações para outras bactérias, implementou-se o IntergenicDB, um
banco de dados com diversas informações sobre as sequencias intergênicas e o
valor de classificação destas para os diferentes fatores σ bacterianos, conforme os
resultados obtidos com o BacPP.