이항분포 (Binomial Distribution)
1. 이항분포란?
이항분포는 성공과 실패 두 가지 결과만 존재하는 실험을 여러 번 시행할 때, 각 시행에서 성공할 확률을 모델링하는 확률 분포임. 각 시행은 서로 독립적이며, 시행의 결과가 이항(두 가지 결과) 중 하나로 나타남.
예를 들어, 동전을 10번 던졌을 때 앞면이 나오는 횟수를 구하는 문제에서 동전 던지기는 성공(앞면)과 실패(뒷면)로 나뉨. 이러한 상황에서 이항분포를 사용하여 앞면이 나오는 확률을 계산할 수 있음.
2. 이항분포의 특징
이항분포는 다음 네 가지 조건을 충족해야 함.
- 시행 횟수가 정해져 있어야 함. (n번 시행)
- 각 시행은 독립적이어야 함. 한 번의 결과가 다른 시행에 영향을 미치지 않아야 함.
- 각 시행의 결과는 성공 또는 실패 두 가지 중 하나여야 함.
- 성공 확률(p)은 매 시행마다 동일해야 함.
3. 이항분포의 확률 질량 함수 (PMF)
이항분포에서 확률 질량 함수(PMF)는 n번 시행 중 k번 성공할 확률을 계산하는 함수임. 이 식은 다음과 같음:
$$
P(X = k) = {n \choose k} p^k (1 - p)^{n - k}
$$
- $( n )$: 시행 횟수
- $( k )$: 성공 횟수
- $( p )$: 성공 확률
- $( {n \choose k} )$: 이항 계수 (조합)
이항 계수는 아래와 같이 구할 수 있음:
$$
{n \choose k} = \frac{n!}{k!(n - k)!}
$$
4. 예시
동전을 5번 던졌을 때, 앞면이 3번 나올 확률을 구해봅시다. 이 경우 (n = 5), (k = 3), (p = 0.5)임.
$$
P(X = 3) = {5 \choose 3} (0.5)^3 (1 - 0.5)^{5 - 3}
$$
$$
= \frac{5!}{3!(5-3)!} (0.5)^3 (0.5)^2 = 10 \times 0.125 \times 0.25 = 0.3125
$$
즉, 동전을 5번 던졌을 때 앞면이 3번 나올 확률은 31.25%임.
5. 평균과 분산
이항분포에서 평균(기댓값)과 분산은 다음과 같음:
- 평균: $( \mu = n \cdot p $)
- 분산: $( \sigma^2 = n \cdot p \cdot (1 - p) )$
이항분포의 표준편차는 분산의 제곱근으로 구할 수 있음:
$$
\sigma = \sqrt{n \cdot p \cdot (1 - p)}
$$
6. 이항분포의 활용 예시
이항분포는 다양한 분야에서 활용됨. 몇 가지 예시는 다음과 같음:
- 의학: 신약의 효능을 테스트할 때, 100명의 환자 중 특정 약물이 효과를 보인 환자의 수를 모델링할 수 있음.
- 마케팅: 이메일 마케팅에서 1000명에게 이메일을 발송했을 때, 특정 행동(예: 클릭, 구매)을 취한 사람의 수를 예측할 수 있음.
- 도박: 주사위를 던졌을 때, 특정 눈이 나오는 횟수를 예측하는 데 사용됨.
7. 결론
이항분포는 성공과 실패로 나눌 수 있는 사건을 여러 번 시행할 때, 성공의 횟수를 확률적으로 예측할 수 있는 매우 유용한 도구임. 이를 통해 다양한 실생활 문제를 수학적으로 분석하고 예측할 수 있음.
'Data Analysis' 카테고리의 다른 글
[DA] A/B 테스트 (0) | 2024.09.24 |
---|---|
[DA] 부트스트랩 (Bootstrap) (0) | 2024.09.23 |
[DA] 범주란? (0) | 2024.08.18 |
[DA] 범주형 데이터와 연속형 데이터의 차이 (0) | 2024.08.18 |
[통계] 독립변수와 종속변수 (0) | 2024.08.06 |
배움에 즐거움을 느끼는 마네의 데이터랩 이미지 출처 : https://www.instagram.com/hoseobiiiiiii._.0410/
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!