![[통계] 이항분포(Binomial Distribution)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fdnd4JF%2FbtsJIhpMvQb%2FOUBcNzYNLmEC4kFePo4kCk%2Fimg.png)
이항분포 (Binomial Distribution)
1. 이항분포란?
이항분포는 성공과 실패 두 가지 결과만 존재하는 실험을 여러 번 시행할 때, 각 시행에서 성공할 확률을 모델링하는 확률 분포임. 각 시행은 서로 독립적이며, 시행의 결과가 이항(두 가지 결과) 중 하나로 나타남.
예를 들어, 동전을 10번 던졌을 때 앞면이 나오는 횟수를 구하는 문제에서 동전 던지기는 성공(앞면)과 실패(뒷면)로 나뉨. 이러한 상황에서 이항분포를 사용하여 앞면이 나오는 확률을 계산할 수 있음.
2. 이항분포의 특징
이항분포는 다음 네 가지 조건을 충족해야 함.
- 시행 횟수가 정해져 있어야 함. (n번 시행)
- 각 시행은 독립적이어야 함. 한 번의 결과가 다른 시행에 영향을 미치지 않아야 함.
- 각 시행의 결과는 성공 또는 실패 두 가지 중 하나여야 함.
- 성공 확률(p)은 매 시행마다 동일해야 함.
3. 이항분포의 확률 질량 함수 (PMF)
이항분포에서 확률 질량 함수(PMF)는 n번 시행 중 k번 성공할 확률을 계산하는 함수임. 이 식은 다음과 같음:
P(X=k)=(nk)pk(1−p)n−k
- (n): 시행 횟수
- (k): 성공 횟수
- (p): 성공 확률
- ((nk)): 이항 계수 (조합)
이항 계수는 아래와 같이 구할 수 있음:
(nk)=n!k!(n−k)!
4. 예시
동전을 5번 던졌을 때, 앞면이 3번 나올 확률을 구해봅시다. 이 경우 (n = 5), (k = 3), (p = 0.5)임.
P(X=3)=(53)(0.5)3(1−0.5)5−3
=5!3!(5−3)!(0.5)3(0.5)2=10×0.125×0.25=0.3125
즉, 동전을 5번 던졌을 때 앞면이 3번 나올 확률은 31.25%임.
5. 평균과 분산
이항분포에서 평균(기댓값)과 분산은 다음과 같음:
- 평균: (μ=n⋅p)
- 분산: (σ2=n⋅p⋅(1−p))
이항분포의 표준편차는 분산의 제곱근으로 구할 수 있음:
σ=√n⋅p⋅(1−p)
6. 이항분포의 활용 예시
이항분포는 다양한 분야에서 활용됨. 몇 가지 예시는 다음과 같음:
- 의학: 신약의 효능을 테스트할 때, 100명의 환자 중 특정 약물이 효과를 보인 환자의 수를 모델링할 수 있음.
- 마케팅: 이메일 마케팅에서 1000명에게 이메일을 발송했을 때, 특정 행동(예: 클릭, 구매)을 취한 사람의 수를 예측할 수 있음.
- 도박: 주사위를 던졌을 때, 특정 눈이 나오는 횟수를 예측하는 데 사용됨.
7. 결론
이항분포는 성공과 실패로 나눌 수 있는 사건을 여러 번 시행할 때, 성공의 횟수를 확률적으로 예측할 수 있는 매우 유용한 도구임. 이를 통해 다양한 실생활 문제를 수학적으로 분석하고 예측할 수 있음.
'Data Analysis' 카테고리의 다른 글
[DA] A/B 테스트 (0) | 2024.09.24 |
---|---|
[DA] 부트스트랩 (Bootstrap) (0) | 2024.09.23 |
[DA] 범주란? (0) | 2024.08.18 |
[DA] 범주형 데이터와 연속형 데이터의 차이 (0) | 2024.08.18 |
[통계] 독립변수와 종속변수 (0) | 2024.08.06 |
배움에 즐거움을 느끼는 마네의 연구소입니다. 이미지 출처 : https://www.instagram.com/hoseobiiiiiii._.0410/
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!