[TIL] 2024-08-26 (ML)TIL/2024.082024. 8. 27. 00:41
Table of Contents
728x90
Today I Learned (2024-08-26)
목차
오늘 공부한 내용
1. KDT (ML)
머신러닝 모델 만들기
- Random Forest Regression 사용
- 만료 일자 예측하기
2. 머신러닝 입문
타이타닉 데이터 EDA
- EDA
- head(), tail(), 각 feature 의미 확인
- 다섯 수치 요약(5 number summary) 확인
- 최소값(minium), 제1사분위수, 제2사분위수, 제3사분위수, 최대값(maximum) 확인하기
- 데이터프레임.describe()
- EDA 에서는 사분위수를 사용
- Q1:제1사분위수 (25%에 해당하는 값)
- Q2:제2사분위수 (50%에 해당하는 값, 중간값)
- Q3:제3사분위수 (75%에 해당하는 값)
- Q4:제4사분위수 (100%에 해당하는 값, 최대값)
- 시각화 하기
- plotly 사용
- 각 feature간 상관관계 확인하기
- heatmap 을 사용하면 직관적으로 확인이 가능하다.
- 연속형 데이터에 대해서만 상관관계 분석 가능
- 범주형 데이터 분석
어려웠던 내용
- 머신러닝
궁금한 내용과 부족한 내용
- 나는 왜 랜덤포레스트회귀만 사용하지?
- 내일 피드백 받고 다른 모델들도 사용해야지
느낀 점
- 과제 보고서 작성이 재미있다. 왜 재미있지? 뭔가를 더 분석하고 싶고, 더 나은 결과를 뽑고 싶은것 같다.
- 하지만 이건 수학이 아직 안나와서겠지...... 흑
'TIL > 2024.08' 카테고리의 다른 글
[TIL] 2024-08-28 (ML) (0) | 2024.08.29 |
---|---|
[TIL] 2024-08-27 (ML) (1) | 2024.08.28 |
[TIL] 2024-08-25 (ML) (0) | 2024.08.26 |
[TIL] 2024-08-24 (0) | 2024.08.25 |
[TIL] 2024-08-23 (0) | 2024.08.25 |
@maneDataLab :: 마네의 데이터랩
배움에 즐거움을 느끼는 마네의 데이터랩 이미지 출처 : https://www.instagram.com/hoseobiiiiiii._.0410/
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!