[TIL] 2024-09-18 (SQL/DA)TIL (2024)/2024.092024. 9. 19. 00:14
Table of Contents
728x90
Today I Learned (2024-09-18)
목차
오늘 공부한 내용
1. SQL
IF / CASE 구문
IF
- IF(Condition, value_if_true, value_if_false)
SELECT checkNumber, amount, IF(amount > 50000, 'Large', 'Small') AS orderSize FROM payments;
- IF(Condition, value_if_true, value_if_false)
CASE
- 여러 조건을 테스트하고 여러 결정 중 하나를 반환
SELECT productName, buyPrice, CASE WHEN buyPrice < 20 THEN 'Cheap' WHEN buyPrice BETWEEN 20 AND 50 THEN 'Moderate' ELSE 'Expensive' END AS priceCategory FROM products;
JOIN
- 여러 조건을 테스트하고 여러 결정 중 하나를 반환
JOIN
두 테이블 간의 관계를 나타내기 위해 사용
SELECT * FROM table A JOIN B ON 조건~
INNER JOIN
교집합
SELECT * FROM ex3 JOIN ex4 ON ex3.id = ex4.id
LEFT JOIN
전체집합 + 교집합
SELECT * FROM ex3 LEFT JOIN ex4 on ex3.id = ex4.id
RIGHT JOIN
차집합
SELECT * FROM ex3 RIGHT JOIN ex4 ON ex3.id = ex4.id
UNION
합집합
두 테이블의 데이터를 세로로 쭉 나열하는 역할
column 의 수가 같아야 중복은 제거
SELECT id FROM ex3 UNION SELECT id FROM ex4;
2. 데이터과학을 위한 통계
선택편향
- 선택편향(selection bias) : 관측 데이터를 선택하는 방식때문에 생기는 오차
- 결국 오해의 소지가 있거나 단편적 결론을 얻게 된다.
- 데이터 스누핑(data snooping) : 뭔가 흥미로운 것을 찾아 광범위하게 데이터를 살피는 것
- 방대한 검색 효과(vast search effect) : 중복 데이터 모델링이나 너무 많은 예측변수를 고려하는 모델링에서 비롯되는 편향 혹은 비재현성
- 가설을 구체적으로 명시하고 음의표본추출 원칙에 따라 데이터를 수집하면 편향을 피할 수 있다.
- 모든 형태의 데이터 분석은 데이터 수집/분석 프로세스에서 생기는 편향의 위험성을 늘 갖고 있다.
표본분포
- 표본통계량(sample statics) : 더 큰 모집단에서 추출된 표본 데이터들로부터 얻은 측정 지표
- 데이터 분포(data distribution) : 어떤 데이터 집합에서의 각 개별 값의 도수분포
- 표본분포(sampling distribution) : 여러 표본들 혹은 재표본들로부터 얻은 표본통계량의 도수분포
- 중심극한정리(central limit theorem) : 표본의 크기가 커질수록 표본분포가 정규분포를 따르는 현상
- 표준오차(standard error) : 여러 표본들로부터 얻은 표본통계량의 변량
부트스트랩
- 부트스트랩(bootstrap) : 현재 표본에서 추가적으로 표본을 복원추출하고 각 표본에 대한 통계랑과 모델을 다시 계산하는 것
- 부트스트랩 표본(bootstrap sample) : 관측 데이터 집하으로부터 얻은 복원추출 표본
- 재표본추출(재표집, 리샘플링, resampling) : 관측 데이터로부터 반복해서 표본추출하는 과정. 부트스트랩과 순열(셔플링) 과정을 포함한다.
어려웠던 내용
- 용어 정의??
궁금한 내용과 부족한 내용
- SQL 활용
느낀 점
- 연휴 끝
- 앞으로 더 열심히
'TIL (2024) > 2024.09' 카테고리의 다른 글
[TIL] 2024-09-20 (ML/DL) (0) | 2024.09.21 |
---|---|
[TIL] 2024-09-19 (DL) (0) | 2024.09.21 |
[TIL] 2024-09-17 (SQL) (1) | 2024.09.17 |
[TIL] 2024-09-16 (SQL) (0) | 2024.09.17 |
[TIL] 2024-09-15 (DB/SQL) (0) | 2024.09.16 |
@mane Lab :: 마네의 연구소
배움에 즐거움을 느끼는 마네의 연구소입니다. 이미지 출처 : https://www.instagram.com/hoseobiiiiiii._.0410/
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!