[TIL] 2024-09-23 (DA)TIL/2024.092024. 9. 24. 00:01
Table of Contents
728x90
Today I Learned (2024-09-23)
목차
오늘 공부한 내용
1. 데이터 과학을 위한 통계
카이제곱분포
- 카이제곱분포는 일반적으로 범주에 속하는 주제 또는 항목의 수와 관련이 있다.
- 카이제곱통계는 귀무 모델의 기댓값에서 벗어난 정도를 측정한다.
F-분포
- F 분포는 측정된 데이터와 관련한 실험 및 선형 모델에 사용된다.
- F 통계량은 관심 요인으로 인한 변동성과 전체 변동성을 비교한다.
푸아송 분포와 그 외 관련 분포들
- 람다(lambda) : 단위 시간이나 단위 면적당 사건이 발생하는 비율
- 푸아송 분포(Poisson distribution) : 표집된 단위 시간 혹은 단위 공간에서 발생한 사건의 도수분포
- 지수분포(exponential distribution) : 한 사건에서 그 다음 사건까지의 시간이나 거리에 대한 도수분포
- 베이불 분포(Weibull distribution) : 사건 발생률이 시간에 따라 변화하는, 지수분포의 일반화된 버전
- 푸아송 분포 : 시간 단위 또는 공간 단위로 표본들을 수집할 때, 그 사건들의 분포를 알려준다.
- 푸아송 분포의 핵심 파라미터는 $\lambda$(람다)이다.
- 람다는 어떤 일정 시간/공간의 구간 안에서 발생한 평균 사건 수를 의미한다.
A/B 검정
- 두 가지 처리 방법, 제품 절차 중 어느 쪽이 다른 쪽보다 더 우월하다는 것을 입증하기 위해 실험군을 두 그룹으로 나누어 진행하는 실험이다.
- 종종 두 가지 처리 방법 중 하나는 기준이 되는 기존 방법이거나 아예 아무런 처리도 하지 않는 방법이 된다.
- 이를 대조군이라고 한다.
- 처리(treatment) : 어떤 대상에 주어지는 특별한 환경이나 조건(약, 가격, 인터넷 뉴스 제목)
- 처리군(처리그룹, treatment group) : 특정 처리에 노출된 대상들의 집합
- 대조군(대조그룹, control group) : 어떤 처리도 하지 않은 대상들의 집합
- 임의화(랜덤화, randomization) : 처리를 적용할 대상을 임의로 결정하는 과정
- 대상(subject) : 처리를 적용할 개체 대상(유의어: 피실험자)
- 검정통계량(test statistics) : 처리 효과를 측정하기 위한 지표
- A/B 검정 실험에서는 미리 하나의 측정 지표를 결정해야 한다.
- 실험을 수행한 뒤 나중에 검정통계량을 선택한다면 연구자 편향이라는 함정에 빠지게 된다
가설검정
- 귀무가설(null hypothesis) : 우연 때문이라는 가설(유의어: 영가설)
- 대립가설(alternative hypothesis) : 귀무가설과의 대조(증명하고자 하는 가설)
- 일원검정(one-way test) : 한 방향으로만 우연히 일어날 확율을 계산하는 가설검정
- 이원검정(two-way) : 양방향으로 우현히 일어날 확율을 계산하는 가설검정
- 귀무가설은 우리가 관찰한 어떤 효과가 특별한 것이 아니고 우연에 발생한 것이라는 개념을 구체화하는 일종의 논리적 구조이다.
- 가설검정은 귀무가설이 사실이라고 가정하고, 확률모형을 생성하여 관찰한 효과가 해당 모델로부터 합리적으로 나올 수 있는 결과인지를 검증하는 것이다.
재표본추출
- 재표본추출이란 랜덤한 변동성을 알아보자는 일반적인 목표를 가지고, 관찰된 데이터의 값에서 표본을 반복적을 추출하는 것을 의미한다.
- 순열검정(permutation test) : 두 개 이상의 표본을 함께 결합하여 관착값들을 무작위로(또는 전부를) 재표본으로 추출하는 과정을 말한다.(유의어: 임의화검정, 임의순열검정, 정확검정)
- 재표본추출 : 관측 데이터로부터 반복해서 표본추출하는 과정
- 복원/비복원(with or without replacement) : 표본을 추출할 때. 이미 한 번 뽑은 데이터를 다음번 추출을 위해 다시 제자리에 돌려 놓거나/다음 추출에서 제외하는 표본추출 방법
어려웠던 내용
- 다양한 검정들
궁금한 내용과 부족한 내용
- 다양한 검정들의 활용...
느낀 점
- 아직 낯설다..
- 많이 써봐야 늘겠지
'TIL > 2024.09' 카테고리의 다른 글
[TIL] 2024-09-25 (NLP) (0) | 2024.09.27 |
---|---|
[TIL] 2024-09-24 (NLP/DA) (2) | 2024.09.25 |
[TIL] 2024-09-22 (통계/DA) (0) | 2024.09.23 |
[TIL] 2024-09-21 (ML/DA/NLP) (1) | 2024.09.22 |
[TIL] 2024-09-20 (ML/DL) (0) | 2024.09.21 |
@maneDataLab :: 마네의 데이터랩
배움에 즐거움을 느끼는 마네의 데이터랩 이미지 출처 : https://www.instagram.com/hoseobiiiiiii._.0410/
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!