Today I Learned (2024-08-26)목차Today I Learned (2024-08-26)오늘 공부한 내용1. KDT (ML)머신러닝 모델 만들기2. 머신러닝 입문타이타닉 데이터 EDA어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. KDT (ML)머신러닝 모델 만들기Random Forest Regression 사용만료 일자 예측하기2. 머신러닝 입문타이타닉 데이터 EDAEDAhead(), tail(), 각 feature 의미 확인다섯 수치 요약(5 number summary) 확인최소값(minium), 제1사분위수, 제2사분위수, 제3사분위수, 최대값(maximum) 확인하기데이터프레임.describe()EDA 에서는 사분위수를 사용Q1:제1사분위수 (25%에 해당하는 값..
Today I Learned (2024-08-16)목차Today I Learned (2024-08-16)오늘 공부한 내용1. 인프런(공공데이터분석하기)정규 표현식으로 데이터 전처리 하기어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. 인프런(공공데이터분석하기)정규 표현식으로 데이터 전처리 하기정규 표현식 라이브러리파이썬 내장 라이브러리이다.import redef get_string(text): if pd.isna(text): return text text = re.sub("[\d\.'\-(nan)\[\]\/]","",text) text = re.sub(" ","",text) text = re.sub(",{2,}","",text) text = re.sub("\+",",",..
데이터 분석에서 데이터 전처리 과정 (Data Preprocessing)목차데이터 분석에서 데이터 전처리 과정 (Data Preprocessing)데이터 전처리란?데이터 전치리 순서1. 데이터 수집2. 데이터 정제3. 데이터 변환4. 데이터 통합5. 데이터 축소데이터 전처리란?데이터 분석에서 데이터 전처리는 매우 중요한 단계이다.데이터 전처리는 원시 데이터를 분석 가능한 형태로 변환하는 과정으로, 데이터의 품질을 높이고 분석 결과의 정확성을 보장하는 데 필수이다.데이터 전치리 순서1. 데이터 수집데이터 전처리의 첫 단계는 데이터를 수집하는 것이다.데이터는 다양한 출처에서 수집될 수 있으며, 일반적으로 다음과 같은 형태로 존재한다.데이터베이스(DB)CSV 파일(.csv)JSON 파일(.json)웹에서 스크..