Desenvolvimento de um reconhecedor óptico de símbolos musicais em partituras monofônicas ocidentais
Mostra/ Apri
Data
2022-12-13Autore
Colle, Leandro Seben
Orientador
Dorneles, Ricardo Vargas
Metadata
Mostra tutti i dati dell'itemAbstract
O reconhecimento óptico de música é a área da computação que estuda formas de identificar e interpretar imagens de símbolos musicais em partituras. A partir da interpretação desses símbolos, é possível estender o estudo para o campo da análise ou da aplicação. Existem projetos que utilizam o reconhecimento óptico de música para transformar as informações visuais das partituras em arquivos musicais de formato MIDI. Por outro lado, existem aplicações que convertem essas informações em formatos mais estruturados, como o MusicXML, possibilitando um trabalho de análise mais amplo, até mesmo para identificação de padrões de composição. Este projeto acadêmico teve como objetivo desenvolver um reconhecedor óptico de partituras monofônicas ocidentais, utilizando técnicas de processamento e classificação de imagens, restringindo-se a alguns dos símbolos musicais existentes e codificando a representação final no formato MIDI. Para o pré-processamento da imagem foram utilizados os métodos de binarização global e de Otsu, o filtro Gaussiano e operações morfológicas de erosão e dilatação. Para a classificação dos símbolos foi adotado um modelo treinado através das técnicas de rede neural convolucional em conjunto com uma rede neural recorrente, utilizando o dataset PRIMUS. Para a predição, além do dataset PRIMUS, foram utilizadas pautas próprias para mais validações e testes de classificação. As pautas próprias foram geradas utilizando o sistema web Noteflight. O protótipo retornou melhores resultados utilizando a binarização de Otsu em conjunto com o filtro Gaussiano, com máscara de 3x3, e o parâmetro de rotação mais adequado para o alinhamento das pautas foi de 0,25 graus. O percentual total de símbolos classificados corretamente atingiu 97,43% para as imagens selecionadas do dataset PRIMUS e 77,38% para as imagens próprias geradas. [resumo fornecido pelo autor]