Business statistics

5. 임의 실험, 기본 결과

뉴욕킴 2024. 5. 19. 19:19

 
실험 (Experiment)

  • 정의: 결과를 만드는 과정 (Definition = the process of making outcome)

임의 실험 (Random Experiment)

  • 정의: 여러 가능한 결과 중 하나로 이어지는 행동이나 과정 (An action or process that leads to one of several possible outcomes)
  • 공정한 실험: 특정 결과를 얻기 위해 조작되지 않은 공정한 실험 (The fair experiment that was not manipulated to get certain outcomes)
  • 특징: 결과를 확실하게 예측할 수 없는 경우, 이는 랜덤 실험이다 ("If the outcome may not be predicted with certainty, then it is Random experiment")

기본 결과 (Elementary Outcome)

  • 정의: 랜덤 실험의 측정된 값(결과) (The measured value (result) of random experiment)
  • 예시:
    • 동전을 던졌을 때 나오는 앞면 또는 뒷면 (Head or Tail appears through coin throwing)
    • 주사위를 굴렸을 때 나오는 1에서 6 사이의 값 (A value between 1 and 6 when a dice is rolled)

표본 공간과 사건 (Sample Space & Event)
표본 공간 (Sample Space, 표본공간, S)

  • 정의: 랜덤 실험의 모든 가능한 결과의 목록 (A list of all possible outcomes of the random experiment)
  • 조건: 결과는 반드시 모든 경우를 포함해야 하며 상호 배타적이어야 한다 (The outcomes must be exhaustive and mutually exclusive)

예시

  1. 동전 두 번 던지기: S = { (H,H), (H,T), (T,H), (T,T) }
    • H는 앞면(Head), T는 뒷면(Tail)을 의미합니다.
    • 동전을 두 번 던질 때 나올 수 있는 모든 가능한 결과의 조합을 나타냅니다.
  2. 주사위 던지기: S = { 1, 2, 3, 4, 5, 6 }
    • 주사위를 던졌을 때 나올 수 있는 모든 가능한 값입니다.
    • 1에서 6까지의 숫자가 나올 수 있습니다.
  3. 두 개의 주사위를 함께 던지기: S = { (1,1), (1,2), (1,3), ..., (6,5), (6,6) }
    • 두 개의 주사위를 던졌을 때 나올 수 있는 모든 가능한 조합입니다.
    • 각 주사위가 가질 수 있는 값(1에서 6)들의 모든 조합을 나타냅니다.

사건 (Event, 사건)

  • 정의: 표본 공간 내의 하나 이상의 단순 사건들의 모음 (A collection or set of one or more simple events in a sample space)
  • 단순 사건 (Simple Event): 표본 공간의 개별 결과 (An individual outcome of a sample space)

예시

  • 두 개의 주사위를 6번 던질 때 발생할 수 있는 가능한 사건들:
    • { (1,6), (2,5), (3,4), (4,3), (5,2), (6,1) }
    • { (1,5), (2,3), (1,4), (2,6), (5,1), (6,4) }
    • { (1,1), (2,6), (2,2), (3,2), (4,5), (1,4) }

확률 (Probability, 확률, 확률량)

  • 정의: 어떤 사건이 발생할 가능성의 정도를 측정한 값 (The probability of an event is a measure of the likelihood that the event will occur)
  • 특징: 모든 사건의 확률은 항상 0에서 1 사이의 값을 가집니다 (The probability of all the events is always from 0 to 1)
    • 0은 사건이 절대 발생하지 않음을 의미합니다 (0 means the event never occurs)
    • 1은 사건이 항상 발생함을 의미합니다 (1 means that the event always occurs)

 

확률의 기본 연산

세 가지 대표적인 논리 연산자: "그리고", "또는", "아니다(~)"

  • 사건 A와 B의 교집합 (A∩B): A와 B가 모두 발생하는 사건
  • 사건 A와 B의 합집합 (A∪B): A 또는 B 또는 둘 다 발생하는 사건
  • 보수 규칙 (not E): 사건 E가 발생하지 않는 것

덧셈 규칙

  • 상호 배타적인 두 사건 C와 D의 경우: P(C 또는 D) = P(C) + P(D)

조건부 확률

조건부 확률: 사건 B가 주어졌을 때 사건 A가 발생할 확률 P(A|B)

  • 예: P(A|B) = P(A와 B) / P(B)

독립 사건

두 사건 A와 B가 독립적이라는 것은 하나의 사건이 다른 사건의 확률에 영향을 미치지 않는 것.

  • P(A|B) = P(A) 또는 P(B|A) = P(B)가 성립하면 독립적임을 증명할 수 있음


 

확률 변수란?

확률 변수: 실험의 각 결과에 숫자를 할당하는 함수 또는 규칙

  • 실험이 수행될 때까지 그 결과가 결정되지 않는 미지의 값
  • 하나의 실험에서 하나 이상의 확률 변수가 생성될 수 있음
  • 보통 XYZ 등으로 표시

예시

  1. 두 개의 동전을 던질 때
    • 사건: HH, HT, TH, TT
    • 확률 변수 X = 나오는 앞면의 수 (2, 1, 0)
  2. 스타벅스의 음료 판매량
    • 표본 공간: {카페 라떼, 아메리카노, 녹차, 카푸치노}
    • 확률 변수 X = 카페 라떼 주문 수

 

이산 확률 변수 vs 연속 확률 변수

  • 이산 확률 변수: 셀 수 있는 값의 개수를 가짐 (예: 스타벅스에서 판매된 카페 라떼 수)
  • 연속 확률 변수: 셀 수 없는 값의 개수를 가짐 (예: 일주일 동안 공부한 시간)

확률 분포란?

  • 확률 함수: 변수와 관련된 결과가 발생할 확률을 제공하는 함수
  • 확률 분포: 확률 변수의 값과 이 값과 관련된 확률을 설명하는 테이블, 공식 또는 그래프

이산 확률 분포 vs 연속 확률 분포

  • 이산 확률 분포: X의 값이 유한하거나 셀 수 있는 경우
  • 연속 확률 분포: 확률 변수가 특정 구간에서 셀 수 없는 값을 가질 수 있는 경우

이산 확률 분포

확률 함수: 확률 변수 X가 특정 값을 가질 확률

  • P(A) = n(A) / n(S)
  • 조건: 0 ≤ P(X=x) ≤ 1, Σ P(X=x) = 1

연속 확률 분포

확률 밀도 함수 (p.d.f.)

  • 확률 값은 0 이상이어야 함
  • 전체 구간의 면적은 1이어야 함
  • 특정 구간에 속하는 확률을 계산하기 위해 사용

 


산 확률 분포

 

이항 분포란?

이항 분포는 이항 실험의 결과입니다. 이는 확률 변수 X가 각 결과를 가질 확률을 할당하는 함수입니다.

 

이항 실험이란?

  • 각 시도에는 두 가지 가능한 결과가 있습니다. (예: 예 또는 아니오, 여자 또는 남자, 앞면 또는 뒷면)
  • 두 결과 중 하나를 성공(SUCCESS)/실패(FAILURE)로 레이블을 붙입니다.
  • 성공 확률 P(Outcome = SUCCESS) = p, 실패 확률 P(Outcome = FAILURE) = 1-p
  • 각 시도는 독립적입니다.

이항 확률 변수 X

  • 이항 확률 변수 X는 n번의 시도에서 성공 횟수입니다.
  • B(n, p) = N번의 시도와 성공 확률 P를 가진 이항 분포
  • X ~ B(n, p): "확률 변수 X는 N번의 시도와 성공 확률 P를 가진 이항 분포를 따릅니다."

베르누이 분포

  • 하나의 이항 실험을 수행할 때 발생하는 확률 분포입니다.
  • 베르누이 실험: 두 가지 결과만 있는 무작위 실험
    • 성공(SUCCESS): 알고 싶은 결과
    • 실패(FAILURE): 그 외의 결과
    • 성공 확률은 p, 실패 확률은 1-p

이항 분포의 전제 조건

  • 이항 분포는 베르누이 실험을 여러 번 반복할 때 발생합니다.
  • 성공 확률 p는 모든 실험에서 동일해야 합니다.
  • 한 시도의 결과는 다른 시도의 결과에 영향을 미치지 않습니다. 즉, 시도는 독립적입니다.

이항 분포 공식

  • n번의 시도에서 성공 횟수가 x일 확률 P(X=x)=(nx)px(1−p)n−xP(X=x) = \binom{n}{x} p^x (1-p)^{n-x}
    • (nx)\binom{n}{x}: 조합, n개 중 x개를 선택하는 경우의 수
    • p: 성공 확률
    • 1-p: 실패 확률

예시 1: 동전을 4번 던질 때 확률 변수 X의 확률 분포 계산

  • 확률 변수 X는 앞면의 수를 나타냅니다. (P = 1/2, N=4) P(X=x)=(4x)(1/2)x(1−1/2)4−xP(X=x) = \binom{4}{x} (1/2)^x (1-1/2)^{4-x} x=0,1,2,3,4x = 0, 1, 2, 3, 4

예시 2: 주사위를 4번 던질 때 6이 나오는 횟수에 대한 확률 분포 계산

  • 확률 변수 X는 6이 나오는 횟수를 나타냅니다. (P = 1/6, N=4) P(X=x)=(4x)(1/6)x(1−1/6)4−xP(X=x) = \binom{4}{x} (1/6)^x (1-1/6)^{4-x} x=0,1,2,3,4x = 0, 1, 2, 3, 4

이항 분포의 평균과 분산

  • 평균 E(X)=μ=n×pE(X) = \mu = n \times p
  • 분산 V(X)=σ2=n×p×(1−p)V(X) = \sigma^2 = n \times p \times (1-p)

예시 3: 주사위를 5번 던질 때 홀수가 나오는 횟수 계산

  • 확률 변수 X는 주사위를 5번 던질 때 홀수가 나오는 횟수
    • E(X)=μ=5×0.5=2.5E(X) = \mu = 5 \times 0.5 = 2.5
    • V(X)=5×0.5×0.5=1.25V(X) = 5 \times 0.5 \times 0.5 = 1.25

예시 4: Ewha-Cola 다이어트 콜라 시음회

  • Ewha-Cola가 새로운 다이어트 콜라에 대한 선호도를 조사하기 위해 100명의 소비자를 대상으로 시음회를 엽니다.
  • 확률 변수 X는 Ewha-Cola의 새로운 다이어트 콜라를 선택한 소비자 수를 나타냅니다.
  • X는 이항 분포를 따릅니다.
  1. 새로운 다이어트 콜라 시음회가 이항 실험인가요? 왜 그렇습니까?
    • 네, 성공/실패(선택/비선택) 두 가지 결과가 있기 때문입니다.
  2. 동일한 실험을 두 번 이상 반복했나요? 왜 그렇습니까?
    • 네, 100명의 소비자를 대상으로 시음회를 열었기 때문에 100번의 실험을 한 것입니다.
  3. 각 실험에서 성공 확률이 동일했나요?
    • 네, 각 소비자가 Ewha-Cola의 새로운 다이어트 콜라를 선택할 확률은 1/3입니다.
  4. 100명의 소비자 간의 실험이 독립적이었나요?
    • 네, 한 소비자의 선택이 다른 소비자의 선택에 영향을 미치지 않았기 때문입니다.

E(X)와 V(X)는 다음과 같습니다:

  • E(X)=100×13=33.33E(X) = 100 \times \frac{1}{3} = 33.33
  • V(X)=100×13×23=22.22V(X) = 100 \times \frac{1}{3} \times \frac{2}{3} = 22.22

포아송 분포

  • 주어진 시간, 거리 또는 면적 내에서 사건이 발생하는 횟수에 대한 확률 분포
  • 평균 도착률 λ로 표현
  • 단위 시간당 평균 도착률이 크지 않아야 함 (λ < 20), λ 가 10이 넘으면 정확히 안나옴 
  • 1시간 동안 버스 3대가 온다. 

연속 확률 분포

정규 분포

  • 확률 변수 X가 특정 구간에 속할 확률을 할당하는 함수
  • 데이터 분포의 중심은 항상 평균(μ)
  • 데이터가 평균에서 얼마나 흩어져 있는지를 표준 편차(σ)로 결정
  • 표준 정규 분포: 평균이 0이고 표준 편차가 1인 정규 분포

예시

  1. 특정 시간 구간에서 컴퓨터 조립 시간의 확률 계산
  2. 여성 카피라이터의 기본 급여가 $75,000를 초과할 확률 계산
  3. 남성 카피라이터 상위 1%보다 높은 급여를 요구하는 최소 급여 계산