[DA] 데이터 전처리(Data Preprocessing)
Data Analysis2024. 8. 5. 00:23[DA] 데이터 전처리(Data Preprocessing)

데이터 분석에서 데이터 전처리 과정 (Data Preprocessing)목차데이터 분석에서 데이터 전처리 과정 (Data Preprocessing)데이터 전처리란?데이터 전치리 순서1. 데이터 수집2. 데이터 정제3. 데이터 변환4. 데이터 통합5. 데이터 축소데이터 전처리란?데이터 분석에서 데이터 전처리는 매우 중요한 단계이다.데이터 전처리는 원시 데이터를 분석 가능한 형태로 변환하는 과정으로, 데이터의 품질을 높이고 분석 결과의 정확성을 보장하는 데 필수이다.데이터 전치리 순서1. 데이터 수집데이터 전처리의 첫 단계는 데이터를 수집하는 것이다.데이터는 다양한 출처에서 수집될 수 있으며, 일반적으로 다음과 같은 형태로 존재한다.데이터베이스(DB)CSV 파일(.csv)JSON 파일(.json)웹에서 스크..

[TIL] 2024-08-01 (미니프로젝트 발표)
TIL (2024)/2024.082024. 8. 3. 18:23[TIL] 2024-08-01 (미니프로젝트 발표)

Today I Learned (2024-08-01)목차Today I Learned (2024-08-01)오늘 공부한 내용1. KDT미니 프로젝트 발표2. 인프런공공데이터로 파이썬 데이터 분석 시작하기어려웠던 내용궁금한 내용과 부족한 내용미니 프로젝트 회고오늘 공부한 내용1. KDT미니 프로젝트 발표가설 : 해안지역에 가까울수록 스포츠 용품 구매율이 높다.Brazilian E-Commerce Public Dataset by Olist 데이터 분석데이터 출처Brazilian E-Commerce Public Dataset by OlistEDA데이터 전처리 과정가설 및 검정데이터 시각화2. 인프런공공데이터로 파이썬 데이터 분석 시작하기데이터 전처리데이터 로드데이터 결측치 확인데이터 타입 변경필요없는 컬럼 삭제이..

[TIL] 2024-07-25 (데이터 시각화)
TIL (2024)/2024.072024. 7. 26. 00:19[TIL] 2024-07-25 (데이터 시각화)

Today I Learned (2024-07-25) 🤔목차오늘 공부한 내용 🧑🏻‍💻1. KDTplotlyplotly 설치모듈 및 그래프 생성FoliumFolium 설치지도(Map) 만들기어려웠던 내용 📚궁금한 내용과 부족한 내용 🙋🏻느낀 점 💡특이사항🚨오늘 공부한 내용 🧑🏻‍💻1. KDTplotlyplotly는 대화형(인터렉티브) 그래프를 만들 수 있도록 도와주는 시각화 라이브러리이다.그래프를 확대하거나 데이터 포인트에 대한 정보를 툴팁으로 확인할 수 있다.plotly 설치plotly를 설치하려면 아래의 커맨드를 입력해준다.pip install plotly모듈 및 그래프 생성graph objects 모듈설명plotly 그래프 생성 및 제어와 기본이 되는 모듈이다.plotly 그래프의..

[TIL] 2024-07-24 (데이터 시각화)
TIL (2024)/2024.072024. 7. 25. 01:03[TIL] 2024-07-24 (데이터 시각화)

Today I Learned (2024-07-24) 🤔목차오늘 공부한 내용 🧑🏻‍💻1. Doit 쉽게 배우는 파이썬 데이터 분석산점도(scatter plot)선 그래프(line plot)상자 그림(box plot)막대 그래프(bar plot)2. KDT (분포형 데이터, 범주형 데이터, 기타 데이터 시각화)분포형 데이터Hist PlotKDE PlotHistplot 과 kdeplot 같이 사용하기Rug PlotDisplot범주형 데이터(Categorical Data)Bar PlotCount PlotBox PlotViolin Plot기타 시각화HeatmapPair PlotPie Chart어려웠던 내용 📚궁금한 내용과 부족한 내용 🙋🏻느낀 점 💡오늘 공부한 내용 🧑🏻‍💻1. Doit 쉽게 ..

[TIL] 2024-07-19
TIL (2024)/2024.072024. 7. 20. 03:13[TIL] 2024-07-19

Today I Learned (2024-07-12) 🤔목차오늘 공부한 내용 🧑🏻‍💻요약1.pandas2.데이터 불러오기3.데이터 확인하기4.데이터 정렬하기5.수치형 자료형6.범주형 자료형7.데이터 선택하기8.필터링(filtering)9.데이터 조작하기어려웠던 내용 📚궁금한 내용과 부족한 내용 🙋🏻느낀 점 💡오늘 공부한 내용 🧑🏻‍💻요약내용이 너무 많다..1. pandas(판다스)판다스란?파이썬 언어로 작성된 데이터를 분석 및 조작하기 위한 라이브러리데이터 과학과 데이터 분석 분야에서 광범위하게 사용된다.시리즈(Series)와 데이터프레임(DataFrame)이라는 객체를 가지고 있다.판다스 설치터미널에 아래의 명령어를 입력해서 설치한다.pip install pandas판다스 데이터 객체..

image