Today I Learned (2024-08-16)목차Today I Learned (2024-08-16)오늘 공부한 내용1. 인프런(공공데이터 분석하기)정규식으로 마스킹 처리하기crosstab 으로 범주형 데이터 연산2. 분석 용어 공부어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. 인프런(공공데이터 분석하기)정규식으로 마스킹 처리하기자동차, 이메일을 정규식을 이용해서 마스킹 처리crosstab 으로 범주형 데이터 연산범주형 데이터를 연산하기 위해 pandas 의 crosstab 함수를 이용함2. 분석 용어 공부범주란?범주형 데이터와 연속형 데이터의 차이어려웠던 내용딱히 없었던 것 같다.궁금한 내용과 부족한 내용pandas pivot-table 과 crosstab 의 차이느낀 점갈 길이..
범주(Category)란 무엇인가서론데이터 분석 공부를 시작하고 범주라는 말을 참 많이 들었다...하지만 아직 "범주가 뭐야?"라고 물으면 대답을 하지 못하는 상황이다. 큰일이군.그래서 이를 해결하고자 전지전능하신 GPT를 이용해 범주란 무엇인가에 대한 글을 작성한다.What's 범주?범주란 데이터를 특정 기준에 따라 나눌 수 있는 그룹을 의미한다.데이터는 여러 가지 특성을 가질 수 있는데, 이 특성에 따라 데이터를 묶어서 관리하면 분석이 훨씬 수월해진다고 한다.예를 들어, '색깔', '종류', '지역' 같은 것이 범주가 될 수 있다.예시예를 들어, 고객 데이터를 분석한다고 생각해보자.고객 데이터에는 여러 가지 정보가 있을 수 있다. 예를 들어, 고객의 성별, 나이, 거주지, 구매 이력 등이 있다.여기서..
범주형 데이터와 연속형 데이터의 차이데이터 분석과 통계에서는 데이터를 이해하고 분석하기 위해 여러 가지 유형으로 분류한다.이 중에서 가장 기본적인 두 가지 데이터 유형은 범주형 데이터(Categorical Data) 와 연속형 데이터(Continuous Data) 이다.범주형 데이터 (Categorical Data)범주형 데이터는 데이터가 특정 범주 또는 그룹으로 구분되는 데이터를 의미한다.이러한 데이터는 고정된 수의 범주를 가지고 있다. 주로 텍스트 또는 숫자로 표현되지만, 이 숫자는 순서나 크기를 의미하지 않는다.예시성별(남성, 여성), 색상(빨강, 파랑, 초록), 지역(서울, 부산, 대구)특징범주형 데이터는 순서가 없는 명복형 데이터와 순서가 있는 순서형 데이터로 구분될 수 있다.명목형 데이터순서가..