2024/05 13

2-2. Deep Belief Networks

사전 지식 KL-Divergence(쿨백-라이블러 발산): 두 확률 분포의 차이를 측정하는 지표→ 주로 두 확률 분포가 얼마나 다른지를 비교하는 데 사용됩니다. KL-Divergence는 정보 이론과 확률 이론에서 많이 사용되며, 분포 간의 거리를 측정하여 모델의 학습 및 평가에 유용하게 활용   DKL(Q || P) vs DKL(P || Q) 일때 차이는?DKL(P || Q)는 확률 분포 P를 기준으로, 분포 Q와의 차이를 나타냅니다. 이는 P를 얼마나 잘 나타내는지를 평가하는 지표로서, 모델의 학습 및 평가에 유용합니다.반면에 DKL(Q || P)는 확률 분포 Q를 기준으로, 분포 P와의 차이를 나타냅니다. 이는 Q를 얼마나 잘 나타내는지를 평가하는 지표로서, 다른 관점에서의 분포 비교에 사용될 수 ..

Technology 2024.05.04

1. 백화점 방문 데이터를 통한 분석

통계학이 필요한 이유와 활용  예를 들어, 회사에서는 매달 공급업체에게 1만 개 이상의 송장을 지불하지만, 일부 송장이 잘못 지불되었다는 사실을 알게 되었습니다. 하지만, 모든 송장을 검토할 자원이 없기 때문에, 오류가 있는 송장의 비율을 추정하기 위해 일부 송장만을 선택하여 검토하기로 결정합니다. 이 경우, 오류가 있는 송장의 비율을 정확하게 추정하기 위해 얼마나 많은 송장을 샘플로 선택해야 하는지가 중요한 문제가 됩니다. 이와 같이, 사업 결정을 내리거나 부품을 만들 때, 통계학은 핵심 정보를 제공할 수 있습니다. 마케팅에서도 통계학은 중요한 역할을 합니다. 많은 기업들이 고객 데이터를 분석하기 위해 CRM(Customer Relationship Management)을 사용하고, 상관관계 분석이나 데..

Business statistics 2024.05.03

2-1. Generative Models

Generative Models 판별 모델 (Discriminative Models):판별 모델은 입력 데이터를 특정 클래스 또는 레이블로 분류하는 데 중점을 둡니다.입력 데이터와 해당 클래스 간의 관계를 학습하여, 새로운 입력 데이터가 주어졌을 때 어떤 클래스에 속하는지를 결정합니다.주어진 데이터의 특징을 기반으로 각 클래스를 구분하기 위한 경계를 학습합니다.예시로는 로지스틱 회귀, 의사결정 트리, 서포트 벡터 머신 등이 있습니다.판별 모델은 데이터의 분류 및 회귀와 같은 작업에 주로 사용됩니다.생성 모델 (Generative Models):생성 모델은 주어진 데이터의 분포를 학습하여 새로운 데이터를 생성하는 데 중점을 둡니다.데이터의 확률 분포를 학습하고, 이를 기반으로 새로운 데이터를 생성합니다.생..

Deep Learning 2024.05.02
728x90