Generative_model

2022-12-29, 김혜원

이번 포스팅은 생성모델 중 자주 사용되는 모델들에 대한 개요입니다.

생성모델이란?

생성모델은 랜덤 변수로부터 모델이 학습 데이터의 분포 자체를 학습하여 그와 유사한 분포를 가지는 데이터를 생성하는 모델입니다. 생성모델의 종류에는 GAN(Generative Adversarial Network), VAE(Variational Auto-Encoder), Normalizing flow model 등이 있습니다. 각 모델 구조는 아래 그림과 같습니다.

GAN은 생성기(Generator)와 판별기(Discriminator)로 이루어져 있습니다. 생성기는 노이즈 변수로부터 최대한 실제 데이터와 유사한 데이터를 생성하여 판별기를 속이려 하고, 판별기는 실제 데이터와 가짜 데이터를 구별합니다. 이러한 경쟁을 통해 학습을 하면서 생성기가 실제와 매우 유사한 데이터를 생성하게 됩니다. 하지만 GAN에는 Mode-collapse 라는 한계점이 존재합니다. Mode-collapse(아래 그림)는 모델이 국소점에 빠져 더이상 학습이 진행되지않는 상태로, 생성기가 만든 데이터가 실제와 매우 흡사한 경우 혹은 생성기가 너무 쉬운 데이터만 생성하는 경우 등 판별기가 가짜 데이터를 실제 데이터라고 판별하는 것을 말합니다.