[TIL] 2024-09-10 (DL/DA/SQL)
TIL/2024.092024. 9. 11. 00:31[TIL] 2024-09-10 (DL/DA/SQL)

Today I Learned (2024-09-10)목차Today I Learned (2024-09-10)오늘 공부한 내용1. KDT(DL)생성형 AI(Diffusers)부동소수점Stable Diffusers딥러닝 어텐션 (Attention)2. 데이터 과학을 위한 통계변이추정데이터 분포 탐색이진 데이터와 범주형 데이터 탐색하기상관관계두 개 이상의 변수 탐색임의표본추출과 표본편향SQLLIKEBETWEENNOT BETWEEN어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. KDT(DL)생성형 AI(Diffusers)의존성 설정딥러닝 모델 실행을 위해 Python 3.8에서 주로 사용파라미터 설정모델의 성능에 영향을 주는 주요 요소프롬프트모델에 명령어를 입력해 원하는 결과를 얻음네거티브 프롬프..

[TIL] 2024-09-07 (ML)
TIL/2024.092024. 9. 8. 00:33[TIL] 2024-09-07 (ML)

Today I Learned (2024-09-07)목차Today I Learned (2024-09-07)오늘 공부한 내용1. 머신러닝중요도에 따른 feature 정리디폴트 테스트어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. 머신러닝중요도에 따른 feature 정리분류 확률을 계산하는데 기여한 정보를 피처 중요도라고 함결과에 유의미한 영향을 주는 feature 만을 중심으로 머신러닝 기법을 적용하기도 함디폴트 테스트하이퍼 파라미터 튜닝을 통해 각 머신러닝 모델을 보다 최적화할 수 있지만, 우선 디폴트값으로 바로 예측 가능어려웠던 내용없었다.궁금한 내용과 부족한 내용더 다양한 머신러닝 사용느낀 점이사때문에 자기전에 겨우 공부를 한다.이사 쉽지 않다... -->

[TIL] 2024-09-04 (ML)
TIL/2024.092024. 9. 5. 00:48[TIL] 2024-09-04 (ML)

Today I Learned (2024-09-04)목차Today I Learned (2024-09-04)오늘 공부한 내용1. KDT (ML)논리게이트논리게이트 좌표계퍼셉트론비용 함수활성 함수모델 복잡도와 설계학습 과정 시각화피처 선택어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. KDT (ML)논리게이트게이트논리기호논리식진리표연산AND∧A ∧ BA와 B 모두 1일 때만 1곱셈OR∨A ∨ BA 또는 B 중 하나가 1이면 1덧셈NOT¬¬AA가 1이면 0, 0이면 1반전NAND⊼¬(A ∧ B)A와 B가 모두 1일 때만 0AND의 반전NOR⊽¬(A ∨ B)A 또는 B 중 하나가 1이면 0OR의 반전XOR⊕A ⊕ BA와 B가 다를 때 1배타적 덧셈XNOR⊙¬(A ⊕ B)A와 B가 같을 때 1XO..

[TIL] 2024-09-03 (DL/ML/Bigquery)
TIL/2024.092024. 9. 4. 00:25[TIL] 2024-09-03 (DL/ML/Bigquery)

Today I Learned (2024-09-03)목차Today I Learned (2024-09-03)오늘 공부한 내용1. KDT (DL)딥러닝 개념딥러닝 모델 구축 단계통계모델/머신러닝/딥러닝 비교표이미지 데이터 처리2. 머신러닝교차 검증(Cross Validation)Holdout Cross ValidationK-fold Cross Validationsklearn 의 Cross Validation & K-fold 사용법3. Pandas & BigqueryBigquery 쿼리문제 풀기어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. KDT (DL)딥러닝 개념입력층, 은닉층, 출력층입력층데이터를 받아들이는 역할은닉층입력 데이터를 처리하여 패턴을 학습. 은닉층의 개수가 많을수록 모델은 더..

[TIL] 2024-09-01 (ML)
TIL/2024.092024. 9. 2. 00:20[TIL] 2024-09-01 (ML)

Today I Learned (2024-09-01)목차Today I Learned (2024-09-01)오늘 공부한 내용1. 머신러닝K-Nearest Neighbor(KNN)Logistic Regression(로지스틱 회귀)SVM(Support Vector Machine) / SVCDecision Tree(의사결정나무)Ensemble(앙상블)편향(Bias) 와 분산(Variance)Ensemble과 Bagging, BoostingBagging : Random ForestBagging : Extra Tree2. 메타코드(Pandas와 Bigquery를 활용한 데이터 분석)Pandas어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. 머신러닝K-Nearest Neighbor(KNN)기본적인 머..

[TIL] 2024-08-28 (ML)
TIL/2024.082024. 8. 29. 00:14[TIL] 2024-08-28 (ML)

Today I Learned (2024-08-28)목차Today I Learned (2024-08-28)오늘 공부한 내용1. KDT (ML)XAI(설명 가능한 AI)ShapCalculusThe Squeeze TheoremMachine Learning타이타닉 수치형 데이터 EDA어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. KDT (ML)XAI(설명 가능한 AI)화이트박스 모델이다.예) decision treeShap기계 학습 모델의 예측 결과를 설명하기 위한 방법론 중 하나이다.입력 특성의 기여도를 정량화하여, 모델이 왜 특정 예측했는지 예측할 수 있게 한다.feature importances와 거의 유사한 수치를 보여준다.예시 코드import xgboostimport shapfrom..

[TIL] 2024-08-27 (ML)
TIL/2024.082024. 8. 28. 00:21[TIL] 2024-08-27 (ML)

Today I Learned (2024-08-27)목차Today I Learned (2024-08-27)오늘 공부한 내용1. KDT (ML)회귀 모델 평가 지표분류 모델 평가 지표추천 시스템 모델의 평가 지표과적합이 일어나는 이유과적합 감지과적합 방지과소적합불균형 데이터 처리 imbalanced-learn어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. KDT (ML)회귀 모델 평가 지표MAE(Mean Absolute Error)모델의 예측값과 실제값의 차이의 절대값의 평균절대값을 취하기 때문에 가장 직관적으로 알 수 있는 지표이다.오차가 커졌을 때 상대적으로 중요하지 않게 나타날 수 있다. MSE(Mean Squared Error)오차카 커질수록 가중치가 커진다.오차가 큰 값일 경우 더..

[TIL] 2024-08-26 (ML)
TIL/2024.082024. 8. 27. 00:41[TIL] 2024-08-26 (ML)

Today I Learned (2024-08-26)목차Today I Learned (2024-08-26)오늘 공부한 내용1. KDT (ML)머신러닝 모델 만들기2. 머신러닝 입문타이타닉 데이터 EDA어려웠던 내용궁금한 내용과 부족한 내용느낀 점오늘 공부한 내용1. KDT (ML)머신러닝 모델 만들기Random Forest Regression 사용만료 일자 예측하기2. 머신러닝 입문타이타닉 데이터 EDAEDAhead(), tail(), 각 feature 의미 확인다섯 수치 요약(5 number summary) 확인최소값(minium), 제1사분위수, 제2사분위수, 제3사분위수, 최대값(maximum) 확인하기데이터프레임.describe()EDA 에서는 사분위수를 사용Q1:제1사분위수 (25%에 해당하는 값..

image