[DA] A/B 테스트
Data Analysis2024. 9. 24. 00:11[DA] A/B 테스트

A/B 테스트란 무엇인가?A/B 테스트는 두 개 이상의 변형(A와 B)을 비교하여 어떤 변형이 더 나은 결과를 도출하는지 평가하는 실험 방법임. 교육업계에서도 학습 효율성을 높이거나 사용자 경험을 개선하기 위해 A/B 테스트가 효과적으로 사용될 수 있음. 이를 통해 학습 콘텐츠나 플랫폼에서 가장 효과적인 전략을 선택할 수 있음.A/B 테스트의 기본 원리A/B 테스트의 기본 원리는 다음과 같음:변형 정의: 테스트할 두 가지 이상의 변형(예: A와 B)을 만듦.트래픽 분배: 학생이나 학습자를 무작위로 각 변형에 할당함. 예를 들어, 전체 학습자 중 50%는 A 변형을, 나머지 50%는 B 변형을 경험하게 됨.성과 측정: 각 변형에 대한 학습자의 행동(예: 퀴즈 점수, 수강 완료율)을 분석하여 어느 변형이 더..

[TIL] 2024-09-23 (DA)
TIL (2024)/2024.092024. 9. 24. 00:01[TIL] 2024-09-23 (DA)

Today I Learned (2024-09-23)목차Today I Learned (2024-09-23)오늘 공부한 내용1. 데이터 과학을 위한 통계카이제곱분포F-분포푸아송 분포와 그 외 관련 분포들A/B 검정가설검정재표본추출어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. 데이터 과학을 위한 통계카이제곱분포카이제곱분포는 일반적으로 범주에 속하는 주제 또는 항목의 수와 관련이 있다.카이제곱통계는 귀무 모델의 기댓값에서 벗어난 정도를 측정한다.F-분포F 분포는 측정된 데이터와 관련한 실험 및 선형 모델에 사용된다.F 통계량은 관심 요인으로 인한 변동성과 전체 변동성을 비교한다.푸아송 분포와 그 외 관련 분포들람다(lambda) : 단위 시간이나 단위 면적당 사건이 발생하는 비율푸아송 분포(..

[DA] 부트스트랩 (Bootstrap)
Data Analysis2024. 9. 23. 01:10[DA] 부트스트랩 (Bootstrap)

부트스트랩 (Bootstrap)부트스트랩(Bootstrap)은 통계적 방법론 중 하나로, 데이터에서 반복적으로 샘플을 추출해 통계량의 분포를 추정하는 비모수적 리샘플링 기법임. 주로 표본 크기가 작거나, 데이터가 정규분포를 따르지 않는 경우에도 신뢰구간을 추정하거나 통계적 추론을 할 수 있도록 도와줌.부트스트랩의 주요 개념리샘플링(Resampling): 주어진 표본 데이터에서 반복적으로 샘플을 복원 추출하여 새로운 표본을 여러 번 생성하는 과정. 이때 각 리샘플은 원본 데이터와 동일한 크기로 생성됨.추정량의 분포: 리샘플링을 통해 얻은 각 샘플에서 통계량(평균, 분산 등)을 계산하여 그 분포를 구할 수 있음. 이를 통해 표본 통계량의 신뢰구간, 표준 오차 등을 추정할 수 있음.비모수적 방법: 부트스트랩은..

[통계] 이항분포(Binomial Distribution)
Data Analysis2024. 9. 23. 00:38[통계] 이항분포(Binomial Distribution)

이항분포 (Binomial Distribution)1. 이항분포란?이항분포는 성공과 실패 두 가지 결과만 존재하는 실험을 여러 번 시행할 때, 각 시행에서 성공할 확률을 모델링하는 확률 분포임. 각 시행은 서로 독립적이며, 시행의 결과가 이항(두 가지 결과) 중 하나로 나타남.예를 들어, 동전을 10번 던졌을 때 앞면이 나오는 횟수를 구하는 문제에서 동전 던지기는 성공(앞면)과 실패(뒷면)로 나뉨. 이러한 상황에서 이항분포를 사용하여 앞면이 나오는 확률을 계산할 수 있음.2. 이항분포의 특징이항분포는 다음 네 가지 조건을 충족해야 함.시행 횟수가 정해져 있어야 함. (n번 시행) 각 시행은 독립적이어야 함. 한 번의 결과가 다른 시행에 영향을 미치지 않아야 함. 각 시행의 결과는 성공 또는 실패 두 ..

[TIL] 2024-09-22 (통계/DA)
TIL (2024)/2024.092024. 9. 23. 00:18[TIL] 2024-09-22 (통계/DA)

Today I Learned (2024-09-22)목차Today I Learned (2024-09-22)오늘 공부한 내용1. pandas 데이터 전치리 및 시각화ConcatMergeinner : 내부 조인- SQL 의 INNER JOIN 과 동일(default)outer : 완전 외부 조인 - SQL의 OUTER JOIN 과 동일left : 왼쪽 우선 외부 조인 - SQL의 LEFT OUTER JOIN 과 동일right : 오른쪽 우선 외부 조인 - SQL의 RIGHT OUTER JOIN 과 동일2. 데이터과학을 위한 통계부트스트랩(bootstrap)재표본추출 대 부트스트래핑신뢰구간정규분포긴 꼬리 분포t-분포이항분포(Binomial Distribution)어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘..

[TIL] 2024-09-21 (ML/DA/NLP)
TIL (2024)/2024.092024. 9. 22. 00:23[TIL] 2024-09-21 (ML/DA/NLP)

Today I Learned (2024-09-21)목차Today I Learned (2024-09-21)오늘 공부한 내용1. 머선러닝Voting 이해하기Hard Voting ClassifierSoft Voting ClassifierBootstrapOut-Of-Bag 샘플OOB 스코어ROC Curve 란ROC Curve 와 AUC2. 데이터분석EDA(Exploratory Data Analysis)3. KDT챗봇 성능 향상 시키기어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. 머선러닝Voting 이해하기Voting Classifier일종의 앙상블(ensemble) 의 또다른 기법으로(Bagging,Boosting), 여러 모델들을 기반으로, 투표를 하는 Voting 기법이 있음해당 기법을 ..

[TIL] 2024-09-20 (ML/DL)
TIL (2024)/2024.092024. 9. 21. 00:37[TIL] 2024-09-20 (ML/DL)

Today I Learned (2024-09-20)목차Today I Learned (2024-09-20)오늘 공부한 내용1. KDT질의응답 챗봇 만들기(발표)2. 머신러닝타이타닉 데이터 캐글에 올리기어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. KDT질의응답 챗봇 만들기(발표)발표자가 아니였지만 그래도 많이 깨지지는 않았다.수정할게 많지는 않지만 자연어라 까다롭다.2. 머신러닝타이타닉 데이터 캐글에 올리기머신러닝 학습 후 캐글에 처음 제출해봤다.어려웠던 내용서비스 개선궁금한 내용과 부족한 내용자연어 처리 모델들?느낀 점자연어 처리는 어렵다.캐글 첫 제출. 뜻깊다. -->

[TIL] 2024-09-19 (DL)
TIL (2024)/2024.092024. 9. 21. 00:30[TIL] 2024-09-19 (DL)

Today I Learned (2024-09-19)목차Today I Learned (2024-09-19)오늘 공부한 내용1. KDT질의응답 챗봇 만들기어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. KDT질의응답 챗봇 만들기자연어를 입력하다보니 예외처리를 많이 해줘야했다.그리고 한국어이다 보니 더 했고, 초등학교 4학년 대상이라 더 많이 예외처리를 해줘야겠다.어려웠던 내용성능 테스트궁금한 내용과 부족한 내용성능 테스트느낀 점성능 테스트가 어려웠다 -->

image