[TIL] 2024-08-25 (ML)TIL/2024.082024. 8. 26. 00:42
Table of Contents
728x90
Today I Learned (2024-08-25)
목차
오늘 공부한 내용
1. 머신러닝
어떻게 분류(Classification)할 수 있을까?
- 샘플 : 수집된 다양한 데이터(전체 데이터가 아님, 원본 데이터를 전처리한 데이터)
- 샘플을 두 집합으로 분리
- 훈련 집합(Training Set) : 정답까지 포함되어 있는 샘플들
- 테스트 집합(Test Set) : 정답은 빠져 있는 샘플들
- 분류기 설계 : 분류할 모델 선정 (알고리즘 또는 모델 -> 함수로 생각하면 쉬움)
- 클래스로 만들어진 객체
- 분류할 모델에 맞도록 샘플에서 특징(Feature) 추출 또는 가공(보통, feature engineering 이라고 함)
- 훈련 집합을 분류기에 넣어, 학습
- 테스트 집합으로 분류기 성능 평가
샘플을 어떻게 컴퓨터에 전달할까?
- 변환하기
- 0과 1로 이루어진 데이터로 변환하기
- 행렬로 처리하기
- 0과 1로 바뀐 데이터를 특별한 수학식을 사용해 벡터로 만들기 (특징 추출)
- 벡터를 통해, 각 부류(class)가 주로 위치한 공간을 구분할 수 있는 선을 그어 판단
- 선은 특별한 수학 기법으로 작성됨(이를 모델이라고 함)
- y = wx + a
분류가 정확한지 어떻게 확인할까? - 성능평가
- 분류 목적에 맞게, 정의한 수학식을 통해, 분류 성능을 평가
- 단순히 맞다/아니다 외의 분류 목적에 맞게 다양항 성능 평가식이 있을 수 있다.
- 예: 많이 사용되는 성능 평가식 - Precision(정밀도), Recall(재현율)
- 이외의 다양한 성능 평가식이 있음
- Precision(정밀도) : $\frac{TP}{TP+FP}$
- Recall(재현율) : $\frac{TP}{TP+FN}$
- TP(True Positive)
- FP(False Positive)
- FN(False Negative)
- TN(True Negative)
조건부, 결합, 주변 확률 이해
- 조건부 확률
- 어떤 사건이 일어났다는 조건 하에 다른 사건이 일어날 확률
- 결합 확률
- 두 가지 사건이 동시에 일어날 확률
- 주변 확률
- 두 사건 이상이 동시에 일어났 수 있을 때, 하나의 특정 사건에 주목하여 그것이 일어날 확률
정리
- 데이터 수집
- 데이터 전처리(보통 숫자로 변환)
- 특징 가공 및 추출
- 모델 정의 -> 훈련 집합으로 모델 학습
- 테스트 집합으로 학습된 모델 테스트
- 정의한 성능 평가식으로 평가
어려웠던 내용
- 머신러닝
궁금한 내용과 부족한 내용
- 머신러닝
느낀 점
- 좋아. 해보자고
'TIL > 2024.08' 카테고리의 다른 글
[TIL] 2024-08-27 (ML) (1) | 2024.08.28 |
---|---|
[TIL] 2024-08-26 (ML) (0) | 2024.08.27 |
[TIL] 2024-08-24 (0) | 2024.08.25 |
[TIL] 2024-08-23 (0) | 2024.08.25 |
[TIL] 2024-08-22 (ML) (0) | 2024.08.23 |
@maneDataLab :: 마네의 데이터랩
배움에 즐거움을 느끼는 마네의 데이터랩 이미지 출처 : https://www.instagram.com/hoseobiiiiiii._.0410/
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!