Technology
2-3. Variational Autoencoder (VAE)
뉴욕킴
2024. 5. 10. 20:37
변분 자동 인코더 (Variational Autoencoder, VAE)
VAE는 딥러닝 모델 중 하나로, 데이터를 어떻게 생성할 수 있는지를 배우는 모델입니다. 이 모델은 데이터에서 중요한 특징을 추출하고, 이를 바탕으로 새로운 데이터를 생성할 수 있습니다.
- 인코더(Encoder): 이 부분은 입력 데이터(예: 사진)를 받아서 그 데이터의 핵심을 나타내는 숫자들의 집합(잠재 벡터)으로 바꿔 줍니다. 잠재 벡터는 입력 데이터를 대표하는 중요한 정보만을 포함하고, 이는 일종의 압축된 형태로 볼 수 있습니다.
- 디코더(Decoder): 인코더에서 생성된 잠재 벡터를 다시 원래의 데이터 형태(예: 사진)로 복원합니다. 이 과정을 통해 모델은 데이터를 어떻게 생성해야 하는지를 배웁니다.
변분 추론 (Variational Inference)
변분 추론은 복잡한 확률 모델에서 어떤 사건이 일어날 확률을 계산하는 방법입니다. 이론적으로 계산하기 어려운 경우, 간단한 방법으로 근사하여 계산합니다.
- 후방 확률(Posterior probability): 데이터가 주어졌을 때, 특정 사건(잠재 변수)이 발생할 확률입니다. 예를 들어, 사진에 고양이가 있을 확률을 계산하는 것을 생각해 볼 수 있습니다.
- 근사(Approximation): 실제로 이 확률을 계산하기는 매우 어렵습니다. 그래서 우리는 이를 간단한 형태로 근사하여 계산합니다. 이 때 사용되는 간단한 형태의 예는 정규 분포입니다.
변분 하한 (ELBO, Evidence Lower Bound)
ELBO는 근사한 확률이 실제 확률과 얼마나 가까운지를 측정하는 지표입니다. 이 값을 최대화하는 것이 변분 추론의 목표입니다.
- KL 발산(Kullback-Leibler Divergence): 이는 두 확률 분포 사이의 차이를 측정하는 방법입니다. 변분 추론에서는 근사 분포와 실제 분포 사이의 차이를 이 값으로 측정합니다.
- 재파라미터화 트릭(Reparameterization Trick): VAE의 학습을 돕기 위해 사용되는 기술입니다. 잠재 변수를 생성할 때 사용되며, 더욱 효율적인 학습을 가능하게 합니다.
이 트릭의 중요성:
- 미분 가능성: 역전파를 사용하여 VAE 모델 전체를 효율적으로 학습할 수 있게 합니다.
- 변동성 감소: 𝜖 의 사용은 샘플링 과정에서 발생할 수 있는 변동을 줄여, 학습 과정을 안정화시키고 성능을 개선합니다.
재파라미터화 트릭은 VAE 뿐만 아니라 다양한 확률적 모델에서 중요한 학습 도구로 사용됩니다. 이 트릭을 사용함으로써, 복잡한 데이터의 내재된 구조를 모델링하고 새로운 데이터를 생성하는 데 필수적인 역할을 합니다.
간단히 말해서, VAE와 변분 추론은 데이터의 중요한 특징을 추출하고 이를 바탕으로 새로운 데이터를 생성하거나 사건의 확률을 추정하는데 사용됩니다. 이 기술들은 인공지능이 실제 세계의 복잡함을 이해하고, 새로운 정보를 생성하는데 큰 도움을 줍니다.