[TIL] 2024-09-30 (DA/SQL)TIL/2024.092024. 10. 1. 00:41
Table of Contents
728x90
Today I Learned (2024-09-30)
목차
오늘 공부한 내용
1. 데이터 과학을 위한 통계
단순선형회귀
- 회귀방정식은 응답변수 Y와 예측변수 X 간의 관계를 선형함수로 모델링한다.
- 회귀모형은 적합값과 진차, 즉 반응에 대한 예측과 그 예측 오차를 산출한다.
- 회귀모형은 일반적으로 최소제곱법을 이용해 피팅한다.
- 회귀는 예측과 설명 모두에 사용한다.
다중선형회귀
- $Y = b_0+b_1X_1+b_2X_2 + ... +b_pX_p +e$
- 제곱근평균제곱오차(RMSE, Root Mean Square Error) : 회귀 시 평균제곱오차의 제곱근, 회귀모형을 평가하는데 가장 널리 사용되는 측정 지표이다.
- 잔차 표준오차(RSE, Residual Standard Error) : 평균제곱오차와 동일하지만 자유도에 따라 보정된 값
- R 제곱(R-square) : 0에서 1까지 모델에 의해 설명된 분산의 비율(유의어: 결정계수, $R^2$)
- t 통계량(t-statistic) : 계수의 표준오차로 나눈 예측변수의 계수. 모델에서 변수의 중요도를 비교하는 기준이 된다.
- 가중회귀(Weighted Regression) : 다른 가중치를 가진 레코드들을 회귀하는 방법
2. KDT(Database)
SQL(Structured Query Language)
- 관계형 데이터베이스 관리시스템(RDBMS)의 데이터를 관리하기 위해 설계된 특수 목적의 프로그래밍 언어
데이터 스토어
- 회사에서 발생하는 각종 데이터를 모아 둔 공간
데이터 마트
- 데이터스토어 내의 데이터를 분석에 활용할 수 있도록 전처리, 가공하여 빠른 인사이트 도출이 용이하도록 한 테이블 등의 모음
SLQ 문법 종류
SELECT
- SELECT
- FROM
- WHERE
- GROUP BY
- HAVING
- ORDER BY
SQL 활용시의 중요 표현들
- AS : 데이터에 별명을 지정
- LIMIT : 출력할 데이터의 개수를 지정
- DISTINCT : 중복 제거하기
- IF : 조건 만들기
- CASE : 다수의 조건 만들기
어려웠던 내용
- 오늘도 통계...
궁금한 내용과 부족한 내용
- 내일도 통계
느낀 점
- sql 문법을 자주 안쓰니 자꾸 까먹는다..
- 그래도 실습은 풀었다.
'TIL > 2024.09' 카테고리의 다른 글
[TIL] 2024-09-29 (DA/ML) (0) | 2024.09.30 |
---|---|
[TIL] 2024-09-28 (DA) (0) | 2024.09.29 |
[TIL] 2024-09-27 (NLP, DA) (2) | 2024.09.28 |
[TIL] 2024-09-26 (NLP) (0) | 2024.09.27 |
[TIL] 2024-09-25 (NLP) (0) | 2024.09.27 |
@maneDataLab :: 마네의 데이터랩
배움에 즐거움을 느끼는 마네의 데이터랩 이미지 출처 : https://www.instagram.com/hoseobiiiiiii._.0410/
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!