[TIL] 2024-10-04 (ADsP/ML)TIL (2024)/2024.102024. 10. 5. 00:19
Table of Contents
728x90
Today I Learned (2024-10-04)
목차
오늘 공부한 내용
1. ADsP
1과목 2,3 챕터
- 1과목 챕터 2(데이터의 가치와 미래)
- 1과목 챕터 3(가치 창조를 위한 데이터 사이언스와 전략 인사이트)
- 정독 개념 문제풀이
2. 머신러닝
KMeans++
- 초기 Centroid 위치를 보다 신중하게 설정하여, K-Means 의 단점을 보완하는 기법
- 기본 방식은 동일하고, 초기 Centroid 위치 선정 기법만 다름
- K-Means++ 초기 Centroid 결정 방법
- 무작위로 모든 Centroid 를 전체 공간 상에서 랜덤하게 다 설정하지 않고,
- 우선 랜덤하게 하나의 데이터를 선택하여, 해당 데이터를 Centroid 로 설정한 후,
- 나머지 점들과의 거리를 계산하고,
- 이미 지정되어 있는 Centroid 들과 가장 멀리 있는 데이터를 다음 Centroid 로 설정함
- 이를 K 개의 Centroid 가 만들어질 때까지 반복
Hierarchical Clustering (계층적 군집)
- 비슷한 데이터끼리 묶어가면서, 최종적으로 하나의 그룹이 될 때까지 그룹핑하는 알고리즘
- AgglomerativeClustring (병합군집)
- sklearn 에서 제공하는 Agglomerative Hierarchical Clustering 알고리즘으로,
- 가장 작은 단위의 데이터부터, 군집화를 시작하여, 모든 데이터를 묶을 때까지 반복하는 방식
- n_cluster (디폴트 2) 값을 설정하여, 분류할 그룹 갯수를 설정 가능
DBSCAN (밀도 기반 군집화)
- Density-Based Spatial Clustering of Applications with Noise
- 데이터가 세밀하게 몰려 있는 밀도를 기반으로 군집화를 하는 방식
- 특정 반경 내에 데이터가 N개 이상 있으면, 밀도가 높으므로, 그룹핑 하는 방식
- K-Means 와 달리, k 를 미리 정해주지 않아도 된다는 장점이 있음
- 기하하적인 모형에도 그룹핑 성능이 좋음
- sklearn DBSCAN 주요 파라미터
- eps : 디폴트 0.5, 두 데이터간 하나의 그룹으로 묶을 수 있는 최대 거리
- min_samples : 디폴트 5, 특정 데이터에서 특정 거리 안에 min_samples 로 설정한 갯수 이상 있어야, 하나의 군집으로 분류
Spectral Clustering Algorithm (스펙트럼 군집화 알고리즘)
- 데이터 간의 거리에 기반해서 유사도 행렬(affinity matrix 라고 함 작성)
- 유사도 행렬을 주성분 분석(Principal Component Analysis, PCA)를 통해, 데이터의 분산은 유지하고, 더 낮은 차원의 데이터로 변환
- 변환된 데이터를 기반으로 K-Means 등을 사용해서 clustering 을 수행함
PCA (주성분 분석, Principal Component Analysis)
- 차원을 축소하여, 계산 속도를 높이거나, 핵심 특징을 추출하는데 사용되는 수학식으로,
- 데이터의 분산을 최대한 보존하면서, 더 낮은 차원으로 데이터를 변환함
어려웠던 내용
- 머신러닝
궁금한 내용과 부족한 내용
- 없었다.
느낀 점
- 자격증 공부 열심히해서 붙자...
'TIL (2024) > 2024.10' 카테고리의 다른 글
[TIL] 2024-10-06 (ADsP/DA) (0) | 2024.10.06 |
---|---|
[TIL] 2024-10-05 (ADsP) (0) | 2024.10.06 |
[TIL] 2024-10-03 (ADsP) (0) | 2024.10.03 |
[TIL] 2024-10-02 (ML/SQL) (1) | 2024.10.03 |
[TIL] 2024-10-01 (ML/SQL) (1) | 2024.10.02 |
@mane Lab :: 마네의 연구소
배움에 즐거움을 느끼는 마네의 연구소입니다. 이미지 출처 : https://www.instagram.com/hoseobiiiiiii._.0410/
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!