Diarização automática de locutor utilizando distâncias probabilísticas entre modelo

Loading...
Thumbnail Image

Submission Date

Defense Date

2010

Edition

Co-Advisors

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Description

Este trabalho analisa a diarização de locutor, importante processo prévio a tarefas como reconhecimento de locutor e de voz e tarefas de indexação. O objetivo da diarização de locutor é obter segmentos de fala de apenas um locutor. Esses segmentos são então agrupados em conjuntos, de forma que cada conjunto contenha fala de somente um locutor. Essa implementação aborda a diarização de dois locutores, em que existem somente dois locutores no áudio. Para a realização da tarefa, assume-se que não há conhecimento prévio dos locutores e que esses locutores não falam simultaneamente. Para a etapa de detecção de mudança de locutor é utilizado o método DISTBIC. O agrupamento dos segmentos é feito com base na distância Kullback Leibler. Os resultados obtidos são avaliados por um programa disponibilizado pelo NIST, o Instituto Nacional de Padrões e Tecnologia dos Estados Unidos, para a tarefa de diarização de locutor (sic).

Abstract

Citation

Endorsement

Review

Supplemented By

Referenced By

Campus-Sede

Rua Francisco Getúlio Vargas, 1130
CEP 95070-560 - Caxias do Sul

Todos os campi - Como chegar

Central de Atendimento

Youtube

© 2001-2025 Universidade de Caxias do Sul. Todos os direitos reservados

Youtube