![[DA] 범주란?](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FHQjzi%2FbtsI6e9zADC%2FAAAAAAAAAAAAAAAAAAAAAAV8nH_Lkk_2clRqxBU8AnjR35q0RlkBfdiqKmI8oLsu%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1759244399%26allow_ip%3D%26allow_referer%3D%26signature%3DhStExapQ3j%252FlhyfFp2QFO1z%252BBwE%253D)
범주(Category)란 무엇인가서론데이터 분석 공부를 시작하고 범주라는 말을 참 많이 들었다...하지만 아직 "범주가 뭐야?"라고 물으면 대답을 하지 못하는 상황이다. 큰일이군.그래서 이를 해결하고자 전지전능하신 GPT를 이용해 범주란 무엇인가에 대한 글을 작성한다.What's 범주?범주란 데이터를 특정 기준에 따라 나눌 수 있는 그룹을 의미한다.데이터는 여러 가지 특성을 가질 수 있는데, 이 특성에 따라 데이터를 묶어서 관리하면 분석이 훨씬 수월해진다고 한다.예를 들어, '색깔', '종류', '지역' 같은 것이 범주가 될 수 있다.예시예를 들어, 고객 데이터를 분석한다고 생각해보자.고객 데이터에는 여러 가지 정보가 있을 수 있다. 예를 들어, 고객의 성별, 나이, 거주지, 구매 이력 등이 있다.여기서..
![[DA] 범주형 데이터와 연속형 데이터의 차이](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FMQWxn%2FbtsI8kUm0HC%2FAAAAAAAAAAAAAAAAAAAAANbeF1TtcOhbnc4fWLteTV8RixYDRFAoTnumJwyd53xf%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1759244399%26allow_ip%3D%26allow_referer%3D%26signature%3DuxH3Wtcya9LFJu%252FHAZmcg9evZP4%253D)
범주형 데이터와 연속형 데이터의 차이데이터 분석과 통계에서는 데이터를 이해하고 분석하기 위해 여러 가지 유형으로 분류한다.이 중에서 가장 기본적인 두 가지 데이터 유형은 범주형 데이터(Categorical Data) 와 연속형 데이터(Continuous Data) 이다.범주형 데이터 (Categorical Data)범주형 데이터는 데이터가 특정 범주 또는 그룹으로 구분되는 데이터를 의미한다.이러한 데이터는 고정된 수의 범주를 가지고 있다. 주로 텍스트 또는 숫자로 표현되지만, 이 숫자는 순서나 크기를 의미하지 않는다.예시성별(남성, 여성), 색상(빨강, 파랑, 초록), 지역(서울, 부산, 대구)특징범주형 데이터는 순서가 없는 명복형 데이터와 순서가 있는 순서형 데이터로 구분될 수 있다.명목형 데이터순서가..
![[python] 가상환경 세팅(mac)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FwlAu3%2FbtsI1Dnzr8t%2FAAAAAAAAAAAAAAAAAAAAAJVQyBvQHjKc1BmpK5MIMAlVSGZEktnGj3tqTzoFklc2%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1759244399%26allow_ip%3D%26allow_referer%3D%26signature%3DURayiaiOkxIvLvY1pIOE0s6eWb8%253D)
macOS에서 파이썬 가상환경 설정 방법macOS에서 파이썬 가상환경을 설정하는 방법에는 여러 가지가 있습니다. 이 글에서는 Anaconda를 이용한 가상환경 설정 방법과 프로젝트 내에서 직접 가상환경을 만드는 방법 두 가지에 대해 설명하겠습니다.1. Anaconda를 이용한 파이썬 가상환경 설정1.1 아나콘다 설치 확인아나콘다가 설치되어 있다는 가정하에 진행합니다. 만약 설치되지 않았다면, Anaconda 공식 사이트에서 설치할 수 있습니다.1.2 파이썬 버전 확인아나콘다의 파이썬 버전 목록을 확인하려면 다음 명령어를 사용합니다:conda search python1.3 가상환경 생성원하는 파이썬 버전을 지정하여 가상환경을 생성합니다. 예를 들어, python 3.12.4 버전을 사용하여 Test라는 이..
![[SQL] 기본 키(Primary Key)와 외래 키(Foreign Key)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2F0L2dW%2FbtsIYAb7s0a%2FAAAAAAAAAAAAAAAAAAAAAE5N_fQCQY0qrpktXj1fckLKCX_e37Qal_JDzY7-wxwG%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1759244399%26allow_ip%3D%26allow_referer%3D%26signature%3D5C6ts85vkf7MP6wnUC4E%252FmnPD4Y%253D)
SQL 기본 키와 외래 키기본 키(Primary Key, PK)기본키는 테이블 내의 각 행을 고유하게 식별하는 데 사용되는 열 또는 열 집합이다.기본키는 고유해야 하며, NULL 값을 가질 수 없다.기본 키의 특징고유성 : 각 행을 고유하게 식별한다. 즉, 중복값 존재 XNULL 불가 : 기본 키는 NULL 값을 가질 수 없다.기본 키 예제CREATE TABLE Students ( StudentID INT PRIMARY KEY, Name VARCHAR(100), BirthDate DATE);위 예제에서는 StudentID 열은 Student 테이블의 기본 키로 설정되어 있다.따라서 StudentID 는 각 학생을 고유하게 식별하며, NULL 값을 가질 수 없다. 외래 키(Foreign K..
![[통계] 독립변수와 종속변수](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FyGN64%2FbtsIVGYeCsj%2FAAAAAAAAAAAAAAAAAAAAAO2J6kXAVpRfwE7tdc1RPsbNMUESYTIUzval4Cy_-VwL%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1759244399%26allow_ip%3D%26allow_referer%3D%26signature%3DQCmQmIlgQtmKwvkPknvyx1g3M7o%253D)
독립변수와 종속변수독립변수 - 원인종속변수 - 결과이미지출처 : Machine learning 1 - 13. 독립변수와 종속변수독립변수 (Independent Variable)독립변수는 연구자가 조작하거나 변경할 수 있는 변수입니다. 이 변수는 다른 변수에 영향을 미치지만, 그 자체는 다른 변수에 의해 영향을 받지 않습니다. 독립변수는 보통 실험에서 실험 조건이나 처치를 나타내며, 이를 통해 연구자는 종속변수에 대한 영향을 관찰할 수 있습니다.예를 들어, 교육 방법에 따른 학생들의 시험 성적을 연구할 때, 교육 방법이 독립변수가 됩니다.쉽게 말해서 원인이 되는 변수이다.원인변수, 설명변수, 예측변수라고도 한다. 출처(유튜브)종속변수 (Dependent Variable)종속변수는..
![[LaTex] 띄어쓰기](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FoQX8c%2FbtsITs0BAjJ%2FAAAAAAAAAAAAAAAAAAAAAFFjNC5XRFU4tBrTc-S2AnahszNMdo0izl1NMg9jPOei%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1759244399%26allow_ip%3D%26allow_referer%3D%26signature%3D6B%252FWg9FDlsnc%252BA0BvJB9%252BuvuWr4%253D)
서론노션에 수식을 정리하다 보니 띄어쓰기를 어떻게 해야 할지 몰라서 찾아보다가 방법을 찾고 기록을 남기려고 작성한다.방법LaTeX에서 띄어쓰기를 하는 방법은 4가지가 있다.\, : 한칸 띄어쓰기.\; : 두칸 띄어쓰기.\quad : 네칸(= tab) 띄어쓰기.\qquad : 여덟칸(= tab*2) 띄어쓰기.출처 : [LaTeX] 띄어쓰기
![[DA] 데이터 전처리(Data Preprocessing)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FcrXnq3%2FbtsITsGhupr%2FAAAAAAAAAAAAAAAAAAAAAEeL6lFu8dW7mZrDESr4TwZUHB4EhWnq9xHh0KMOz5DL%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1759244399%26allow_ip%3D%26allow_referer%3D%26signature%3DKq9YwuC3f6vaj5AREXizHx4S9gw%253D)
데이터 분석에서 데이터 전처리 과정 (Data Preprocessing)목차데이터 분석에서 데이터 전처리 과정 (Data Preprocessing)데이터 전처리란?데이터 전치리 순서1. 데이터 수집2. 데이터 정제3. 데이터 변환4. 데이터 통합5. 데이터 축소데이터 전처리란?데이터 분석에서 데이터 전처리는 매우 중요한 단계이다.데이터 전처리는 원시 데이터를 분석 가능한 형태로 변환하는 과정으로, 데이터의 품질을 높이고 분석 결과의 정확성을 보장하는 데 필수이다.데이터 전치리 순서1. 데이터 수집데이터 전처리의 첫 단계는 데이터를 수집하는 것이다.데이터는 다양한 출처에서 수집될 수 있으며, 일반적으로 다음과 같은 형태로 존재한다.데이터베이스(DB)CSV 파일(.csv)JSON 파일(.json)웹에서 스크..
![[matplot] 한글 폰트 설정 및 폰트 선명하게 하기](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FGedob%2FbtsIUlUfbBn%2FAAAAAAAAAAAAAAAAAAAAADewRHlj-tMwKDi4HLkF6dCfeMSdscAggqyNLtdmN8My%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1759244399%26allow_ip%3D%26allow_referer%3D%26signature%3D6yxSlQx8nwFnuVyqtMoPufjJowg%253D)
서론matplotlib를 사용해서 시각화를 하다 보면 한글을 사용해야 할 경우가 생기는데, 이때 한글이 깨져서 나오는 문제점이 있다.이를 해결하기 위한 방법이다.라이브러리 추가# 레티나 디스플레이로 폰트가 선명하게 표시되도록 합니다.import matplotlib_inline.backend_inline# 라이브러리를 로드합니다.import pandas as pdimport seaborn as snsimport matplotlib.pyplot as plt한글 폰트 설정 및 디스플레이 설정# 레티나 디스플레이 설정# 폰트를 설명하게 표시되도록 해준다.matplotlib_inline.backend_inline.set_matplotlib_formats('retina')# 한글폰트를 설정합니다.plt.rc('fo..