Identificação de promotores em sequências de DNA de bactérias Escherichia coli através de máquinas de vetores de suporte
View/ Open
Date
2020-07-12Author
Wamser, Gustavo Martins
Orientador
Martinotto, André Luis
Metadata
Show full item recordAbstract
A região promotora, localizada anteriormente à região codificadora dos genes, é essencial para o processo de transcrição presente nas células. Dada a sua importância, a identificação dessas regiões em sequências de DNA é de grande interesse para a comunidade científica. Este trabalho teve como objetivo o desenvolvimento de uma solução para a identificação de regiões promotoras em trechos de DNA de bactérias Escherichia coli. A classificação foi realizada através do método de Máquinas de Vetores de Suporte, fazendo uso da biblioteca LibSVM. Para os treinamentos e validações foram utilizadas sequências de DNA obtidas da base RegulonDB, além de versões embaralhadas dessas mesmas sequências. Os testes foram realizados com diferentes fatores sigma, obtendo-se uma acurácia de 75.6% para o sigma 24, 71.2% para o sigma 28, 71.2% para o sigma 32, 68.4% para o sigma 38, 63.9% para o sigma 54 e 72.2% para o sigma 70 (sic).