범주형 데이터와 연속형 데이터의 차이데이터 분석과 통계에서는 데이터를 이해하고 분석하기 위해 여러 가지 유형으로 분류한다.이 중에서 가장 기본적인 두 가지 데이터 유형은 범주형 데이터(Categorical Data) 와 연속형 데이터(Continuous Data) 이다.범주형 데이터 (Categorical Data)범주형 데이터는 데이터가 특정 범주 또는 그룹으로 구분되는 데이터를 의미한다.이러한 데이터는 고정된 수의 범주를 가지고 있다. 주로 텍스트 또는 숫자로 표현되지만, 이 숫자는 순서나 크기를 의미하지 않는다.예시성별(남성, 여성), 색상(빨강, 파랑, 초록), 지역(서울, 부산, 대구)특징범주형 데이터는 순서가 없는 명복형 데이터와 순서가 있는 순서형 데이터로 구분될 수 있다.명목형 데이터순서가..
Today I Learned (2024-08-17)목차Today I Learned (2024-08-17)오늘 공부한 내용1. 인프런(공공데이터 활용하기)정규표현식 - 전화번호 일부 마스킹 처리2. 데이터 과학을 위한 통계(도서)Chapter 01. 탐색적 분석어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. 인프런(공공데이터 활용하기)정규표현식 - 전화번호 일부 마스킹 처리정규표현식을 이용해 전화번호 일부를 마스킹 처리한다.02-1-67010-**-89+82-10-**-78함수 만들기def mask_phone_number(phone): # 결측치가 있다면 그대로 반환 if pd.isna(phone): return phone # 번호를 - 기준으로 자른다. num = pho..
Today I Learned (2024-08-16)목차Today I Learned (2024-08-16)오늘 공부한 내용1. 인프런(공공데이터분석하기)정규 표현식으로 데이터 전처리 하기어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. 인프런(공공데이터분석하기)정규 표현식으로 데이터 전처리 하기정규 표현식 라이브러리파이썬 내장 라이브러리이다.import redef get_string(text): if pd.isna(text): return text text = re.sub("[\d\.'\-(nan)\[\]\/]","",text) text = re.sub(" ","",text) text = re.sub(",{2,}","",text) text = re.sub("\+",",",..
Today I Learned (2024-08-15)목차Today I Learned (2024-08-15)오늘 공부한 내용1. 인프런(공공데이터분석)전국 도시 공원데이터 분석2. mariaDBDB server start/stop어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. 인프런(공공데이터분석)전국 도시 공원데이터 분석결측치 시각화pandas profilingmissingnoseaborn heatmapplt.background-gradient결측치 처리이상치 처리정규표현식 전처리2. mariaDBDB server start/stop해결 못함...어려웠던 내용마리아DB 설치 후 재부팅 하거나 서버를 닫고 다시 열면 서버가 열리지 않음아직 해결 못했지만 시간을 많이 잡아먹는다.. 아이고궁금..
Today I Learned (2024-08-14)목차Today I Learned (2024-08-14)오늘 공부한 내용1. KDT (Django)Django 애서 rest api 사용하기Basic Algebra(기초대수학)Logical Implications(논리적 함의)어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. KDT (Django)Django 애서 rest api 사용하기django rest framework 설치하기 (Django)pip installpip install djangorestframeworkBasic Algebra(기초대수학)Logical Implications(논리적 함의)조건 A가 만족될 때, B가 만족됨을 추론하는 연산If A, then BA 는 약속B ..
Today I Learned (2024-08-13)목차Today I Learned (2024-08-13)오늘 공부한 내용1. KDT(Django)페이지 생성(책 목록, 저자 목록, 대출 목록)유저 인증(로그인/로그아웃 기능)2. 기초통계학(유튜브 : 표본의 분포)표본의 분포3. Basic Algebra(기초대수학)Logical Operations어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. KDT(Django)페이지 생성(책 목록, 저자 목록, 대출 목록)index 페이지에서 책 목록과 저자 목록을 볼 수 있는 페이지 생성대출 목록을 볼 수 있는 페이지 생성유저 인증(로그인/로그아웃 기능)데이터베이스에 id, password 가 있는지 확인 후 로그인로그아웃 기능 생성2. 기초통계학(..
macOS에서 파이썬 가상환경 설정 방법macOS에서 파이썬 가상환경을 설정하는 방법에는 여러 가지가 있습니다. 이 글에서는 Anaconda를 이용한 가상환경 설정 방법과 프로젝트 내에서 직접 가상환경을 만드는 방법 두 가지에 대해 설명하겠습니다.1. Anaconda를 이용한 파이썬 가상환경 설정1.1 아나콘다 설치 확인아나콘다가 설치되어 있다는 가정하에 진행합니다. 만약 설치되지 않았다면, Anaconda 공식 사이트에서 설치할 수 있습니다.1.2 파이썬 버전 확인아나콘다의 파이썬 버전 목록을 확인하려면 다음 명령어를 사용합니다:conda search python1.3 가상환경 생성원하는 파이썬 버전을 지정하여 가상환경을 생성합니다. 예를 들어, python 3.12.4 버전을 사용하여 Test라는 이..
Today I Learned (2024-08-12)목차Today I Learned (2024-08-12)오늘 공부한 내용1. KDT (django)django(장고) 란?django의 구조django의 특징어드민 페이지 지원2. 유튜브 기초통계학모집단과 표본추출표본추출 방법어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. KDT (django)django(장고) 란?파이썬 웹 프레임워크이다.django의 구조MTV 아키텍쳐이다.Model(모델)Template(템플릿)View(뷰)django의 특징ORM(Object-Relational Mapping)쉽게 말해서 객체와 관계형 데이터베이스를 연결하는 역할을 한다.데이터베이스를 더 편리하게 다루기 위한 도구개발자가 데이터베이스와 소통할 때 일..