![[DA] 범주형 데이터와 연속형 데이터의 차이](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FMQWxn%2FbtsI8kUm0HC%2F4gpEPwEOs9zsIJwMhufJk0%2Fimg.png)
범주형 데이터와 연속형 데이터의 차이데이터 분석과 통계에서는 데이터를 이해하고 분석하기 위해 여러 가지 유형으로 분류한다.이 중에서 가장 기본적인 두 가지 데이터 유형은 범주형 데이터(Categorical Data) 와 연속형 데이터(Continuous Data) 이다.범주형 데이터 (Categorical Data)범주형 데이터는 데이터가 특정 범주 또는 그룹으로 구분되는 데이터를 의미한다.이러한 데이터는 고정된 수의 범주를 가지고 있다. 주로 텍스트 또는 숫자로 표현되지만, 이 숫자는 순서나 크기를 의미하지 않는다.예시성별(남성, 여성), 색상(빨강, 파랑, 초록), 지역(서울, 부산, 대구)특징범주형 데이터는 순서가 없는 명복형 데이터와 순서가 있는 순서형 데이터로 구분될 수 있다.명목형 데이터순서가..
![[TIL] 2024-08-14 (rest api/algebra)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FconIDk%2FbtsI3RUhyBV%2FAaQrPTzKiqfMElJ8kcOJT0%2Fimg.jpg)
Today I Learned (2024-08-14)목차Today I Learned (2024-08-14)오늘 공부한 내용1. KDT (Django)Django 애서 rest api 사용하기Basic Algebra(기초대수학)Logical Implications(논리적 함의)어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. KDT (Django)Django 애서 rest api 사용하기django rest framework 설치하기 (Django)pip installpip install djangorestframeworkBasic Algebra(기초대수학)Logical Implications(논리적 함의)조건 A가 만족될 때, B가 만족됨을 추론하는 연산If A, then BA 는 약속B ..
![[DA] 데이터 전처리(Data Preprocessing)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FcrXnq3%2FbtsITsGhupr%2FBbWkhJKC31rjl87JK4oN2k%2Fimg.png)
데이터 분석에서 데이터 전처리 과정 (Data Preprocessing)목차데이터 분석에서 데이터 전처리 과정 (Data Preprocessing)데이터 전처리란?데이터 전치리 순서1. 데이터 수집2. 데이터 정제3. 데이터 변환4. 데이터 통합5. 데이터 축소데이터 전처리란?데이터 분석에서 데이터 전처리는 매우 중요한 단계이다.데이터 전처리는 원시 데이터를 분석 가능한 형태로 변환하는 과정으로, 데이터의 품질을 높이고 분석 결과의 정확성을 보장하는 데 필수이다.데이터 전치리 순서1. 데이터 수집데이터 전처리의 첫 단계는 데이터를 수집하는 것이다.데이터는 다양한 출처에서 수집될 수 있으며, 일반적으로 다음과 같은 형태로 존재한다.데이터베이스(DB)CSV 파일(.csv)JSON 파일(.json)웹에서 스크..
![[TIL] 2024-08-04 (기초대수학)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbHa0G1%2FbtsISTxJVj9%2FpEOFv1tEeKZvJi4oF1F0q0%2Fimg.jpg)
Today I Learned (2024-08-04)목차Today I Learned (2024-08-04)오늘 공부한 내용1. 인프런(파이썬 공공 데이터분석)공공데이터 포털 상가(상권) 데이터 불러오기한글 폰트 설정 및 폰트 선명하게 하기missingno(결측치 시각화 라이브러리)2. Basic Algebra(기초대수학)Usages of Sets(집합의 활용)어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. 인프런(파이썬 공공 데이터분석)공공데이터 포털 상가(상권) 데이터 불러오기소상공인시장진흥공단_상가(상권)정보한글 폰트 설정 및 폰트 선명하게 하기코드# 레티나 디스플레이로 폰트가 선명하게 표시되도록 합니다.import matplotlib_inline.backend_inlinematplo..
![[TIL] 2024-07-27 (텍스트 마이닝)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fcv0fRj%2FbtsIQpbatxH%2FTKVskuzuDDY7YofZ5KKXDk%2Fimg.jpg)
Today I Learned (2024-07-27) 🤔목차오늘 공부한 내용 🧑🏻💻1. Doit! 쉡게 배우는 파이썬 데이터 분석 (도서)텍스트 마이닝 (대통령 연설문 마이닝)KoNLpy 라이브러리 설치하기의존성 패키지란?2. 게시글 작성어려웠던 내용 📚궁금한 내용과 부족한 내용 🙋🏻느낀 점 💡오늘 공부한 내용 🧑🏻💻1. Doit! 쉡게 배우는 파이썬 데이터 분석 (도서)텍스트 마이닝 (대통령 연설문 마이닝)텍스트 마이닝이란?문자로 된 데이터에서 가치 있는 정보를 얻어 내는 분석 기법이다.형태소 분석텍스트 마이닝을 할 때 가장 먼저 하는 작업은 문장을 구성하는 어절들이 어떤 품사인지 파악한다.KoNLpy 라이브러리 설치하기자바 가 설치되어 있어야 사용할 수 있다.jpype1 은 Ko..
![[쉽파데] 텍스트 마이닝(대통령 연설문)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2F36FRo%2FbtsIQw2iDvn%2Frs0kB0PdDc5YKMkn5mp6wk%2Fimg.png)
텍스트 마이닝대통령 연설문 텍스트 마이닝 Doit! 쉡게 배우는 파이썬 데이터 분석 (도서)텍스트 마이닝이란?문자로 된 데이터에서 가치 있는 정보를 얻어 내는 분석 기법이다.형태소 분리텍스트 마이닝을 할 때 가장 먼저 하는 작업이다.문장을 구성하는 어저들이 어떤 품사인지 파악하는 것.품사 : 명서, 대명사, 수사, 관형사, 부사, 감탄사, 조사, 서술격조사, 동사, 형용사 [참고]어절 : 띄어쓰기대로 여러 글자씩 [참고]프로젝트 세팅하기01. KoNLPy 패키지 설치하기자바 가 설치되어 있어야 사용할 수 있다.[MAC 한국어 자연어처리 KoNLPy 설치]M1칩 Mac에서 KoNLPy 한국어 처리 파이썬 패키지 설치하기02. 의존성 패키지란?어떤 패키지는 다른 패키지의 기능을 이용하기 때문에 다른 패키지를..
![[TIL] 2024-07-26 (특강)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FZeoqG%2FbtsIPxU11tW%2FQZkk0eAPm29rwvtDt8fUrk%2Fimg.jpg)
Today I Learned (2024-07-26) 🤔목차오늘 공부한 내용 🧑🏻💻1. KDT특강2. Doit! 쉡게 배우는 파이썬 데이터 분석 (도서)데이터 분석 프로젝트 - 한국인의 삶을 파악하라!어려웠던 내용 📚궁금한 내용과 부족한 내용 🙋🏻느낀 점 💡오늘 공부한 내용 🧑🏻💻1. KDT특강오늘은 AI센터장님이 오셔서 특강을 해주셨다. 주요 내용은 다음과 같다:데이터 파이프라인: 데이터를 수집, 처리, 저장, 분석하는 전 과정학습 데이터: 모델 학습에 사용되는 데이터의 중요성과 준비 방법xAPI 및 캘리퍼: 학습 분석 표준과 데이터 상호 운용성데이터 웨어하우스, 데이터 레이크, 데이터 마트: 데이터 저장 및 관리 방법의 차이프로세스 마이닝: 비즈니스 프로세스 분석 방법2. Doi..
![[TIL] 2024-07-24 (데이터 시각화)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fb5G8Zq%2FbtsIL9NlhqF%2Fz3PLYxKEAExqVfkK4Yakfk%2Fimg.jpg)
Today I Learned (2024-07-24) 🤔목차오늘 공부한 내용 🧑🏻💻1. Doit 쉽게 배우는 파이썬 데이터 분석산점도(scatter plot)선 그래프(line plot)상자 그림(box plot)막대 그래프(bar plot)2. KDT (분포형 데이터, 범주형 데이터, 기타 데이터 시각화)분포형 데이터Hist PlotKDE PlotHistplot 과 kdeplot 같이 사용하기Rug PlotDisplot범주형 데이터(Categorical Data)Bar PlotCount PlotBox PlotViolin Plot기타 시각화HeatmapPair PlotPie Chart어려웠던 내용 📚궁금한 내용과 부족한 내용 🙋🏻느낀 점 💡오늘 공부한 내용 🧑🏻💻1. Doit 쉽게 ..