Controlando a geração de faces através de Generative Adversarial Networks
Carregando...
Data de Submissão
Data de Defesa
2022-06-28
Edição
Autores
Orientadores
Coorientadores
Editores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Descrição
Generative Advesarial Networks (GANs) são um avanço relativamente recente dentro da área do aprendizado de máquina. Este framework tem sido utilizado em vários trabalhos de sucesso na visão computacional. Estudos sobre síntese de faces costumam usar GANs para produzir novas imagens de rostos humanos. As possibilidades vão desde a alteração das características de um rosto pequeno até a criação de um rosto completamente novo. Este estudo em particular tem como objetivo fazer uma pesquisa exploratória, introduzindo o tema e investigando possíveis aplicações para a síntese de faces. Para começar, foi feita uma revisão sistemática. Em seguida, foi proposto o uso de uma GAN para gerar faces aleatórias utilizando atributos controláveis ??do dataset CelebA. Para avaliar tal cenário, foram utilizadas as métricas FID e IS. Um método baseado em princípios de deep learning foi seguido ao longo desta pesquisa. Métodos relevantes como Noisy Scale-Space e suavização de rótulo unilateral foram aplicados para garantir a convergência GAN e melhores resultados. Para concluir, o melhor modelo teve um desempenho semelhante aos modelos descritos na literatura, atingindo um valor de FID de 23,08 (±1,35). [resumo fornecido pelo autor]
Resumo
Generative Advesarial Networks (GANs) are a relatively recent machine learning approach. As a framework, it has been used in several computer vision successful projects. Studies about face synthesis commonly use GANs in order to produce new images of human faces. The possibilities range from changing small face characteristics to recreating a completely new one. This particular study aims to do an exploratory research, introducing the topic and investigating possible applications for face synthesis. To begin with, a systematic review has been done. Next, it was proposed the use of a GAN to generate random faces using controllable attributes from CelebA dataset. In order to evaluate such scenario, FID and IS metrics were emploied. A method based on deep learning principles was followed along this research. Relevant methods as noisy scale-space and one-sided label smoothing were applied in order to guarantee GAN convergence and better results. To conclude, the best model has performed similarly to models described in literature, reaching a FID value of 23.08 (±1.35). [resumo fornecido pelo autor]
