[LLM] 컨텍스트 윈도우(Context Window)
LLM2024. 10. 22. 01:53[LLM] 컨텍스트 윈도우(Context Window)

컨텍스트 윈도우(Context Window)란?1. 컨텍스트 윈도우의 정의LLM(Large Language Model)에서 컨텍스트 윈도우란 모델이 한 번에 처리할 수 있는 텍스트의 범위를 의미함. 모델이 텍스트를 이해하거나 예측할 때, 동시에 참조할 수 있는 단어 또는 토큰의 수를 제한하는 창(window)임.즉, 모델이 한 번에 처리할 수 있는 최대 입출력 토큰 수(최대 토큰 길이)2. 컨텍스트 윈도우의 역할컨텍스트 윈도우는 모델이 텍스트 내에서 문맥을 파악하고, 그에 따라 적절한 응답을 생성하는 데 매우 중요한 역할을 함. 윈도우 크기가 클수록 모델은 더 많은 문맥 정보를 바탕으로 예측할 수 있지만, 그만큼 계산 비용도 증가함.예시다음과 같은 문장을 보자:"지난 주말에 나는 친구들과 산책을 하면서 ..

[LLM] 토큰(Token)
LLM2024. 10. 22. 01:49[LLM] 토큰(Token)

LLM(대규모 언어 모델)에서의 토큰(Token)1. 토큰이란 무엇인가?LLM(Large Language Model)은 텍스트 데이터를 처리하고 이해할 때 '토큰(token)'이라는 기본 단위를 사용함.토큰은 단어, 부분 단어, 심지어 문장 부호 등으로 구성되며, 모델이 입력 텍스트를 학습하거나 예측할 때 사용하는 최소 단위임.예를 들어, 다음과 같은 문장이 있다고 가정함:"오늘 날씨가 정말 좋다."이 문장을 토큰으로 나누면 다음과 같을 수 있음:"오늘", "날씨", "가", "정말", "좋", "다", "."토큰화 과정에서 단어를 부분적으로 나누는 이유는 모델이 더 작은 단위로 텍스트를 처리함으로써 더 유연하게 다양한 언어 패턴을 학습할 수 있기 때문임.2. 토큰화(Tokenization)토큰화를 통해..

[Git/Slack] git2slack webhook
정보2024. 10. 20. 01:50[Git/Slack] git2slack webhook

GitHub Actions를 사용해 Slack으로 알림 보내기GitHub Actions를 사용해 코드가 푸시될 때마다 Slack에 알림을 보내는 방법을 단계별로 설명합니다. 이 방법을 사용하면 팀원들이 실시간으로 코드 변경 사항을 공유받을 수 있습니다.1. Slack에서 Incoming Webhook 설정하기1.1 Slack에 Incoming Webhook 추가Slack에서 Incoming Webhook을 설정하려면, 먼저 Slack API를 통해 Webhook을 추가해야 합니다.Slack에 Webhook을 추가하고, 메시지가 전달될 채널을 선택합니다.1.2 Slack에 Incoming Webhook 설정앞에서 선택한 채널 또는 다시 선택Webhook URL 복사해두기 Webhook 설명슬랙에 보여질..

[Python] 파이썬으로 Google 스프레드시트 연동하기
파이썬(python)2024. 10. 13. 21:32[Python] 파이썬으로 Google 스프레드시트 연동하기

파이썬으로 Google 스프레드시트 연동하기Google 스프레드시트를 파이썬으로 연동하면 데이터를 편리하게 관리할 수 있음. 이 글에서는 Google API를 통해 파이썬으로 Google 스프레드시트에 접근하는 방법을 단계별로 설명함.1. Google API 설정하기먼저 Google Cloud Platform(GCP)에서 API를 사용하도록 설정해야 함. 아래의 절차를 따라 설정함.Google Cloud Console에 접속하여 새 프로젝트를 생성함. 모든 API 보기 로 이동한 뒤, Google Sheets API를 검색하여 활성화함. API 및 서비스 > 사용자 인증 정보 > 서비스 계정 관리 에서 서비스 계정을 생성함. 서비스 계정을 생성한 후, .json 파일로 인증 키를 다운로드..

[DA] A/B 테스트
Data Analysis2024. 9. 24. 00:11[DA] A/B 테스트

A/B 테스트란 무엇인가?A/B 테스트는 두 개 이상의 변형(A와 B)을 비교하여 어떤 변형이 더 나은 결과를 도출하는지 평가하는 실험 방법임. 교육업계에서도 학습 효율성을 높이거나 사용자 경험을 개선하기 위해 A/B 테스트가 효과적으로 사용될 수 있음. 이를 통해 학습 콘텐츠나 플랫폼에서 가장 효과적인 전략을 선택할 수 있음.A/B 테스트의 기본 원리A/B 테스트의 기본 원리는 다음과 같음:변형 정의: 테스트할 두 가지 이상의 변형(예: A와 B)을 만듦.트래픽 분배: 학생이나 학습자를 무작위로 각 변형에 할당함. 예를 들어, 전체 학습자 중 50%는 A 변형을, 나머지 50%는 B 변형을 경험하게 됨.성과 측정: 각 변형에 대한 학습자의 행동(예: 퀴즈 점수, 수강 완료율)을 분석하여 어느 변형이 더..

[DA] 부트스트랩 (Bootstrap)
Data Analysis2024. 9. 23. 01:10[DA] 부트스트랩 (Bootstrap)

부트스트랩 (Bootstrap)부트스트랩(Bootstrap)은 통계적 방법론 중 하나로, 데이터에서 반복적으로 샘플을 추출해 통계량의 분포를 추정하는 비모수적 리샘플링 기법임. 주로 표본 크기가 작거나, 데이터가 정규분포를 따르지 않는 경우에도 신뢰구간을 추정하거나 통계적 추론을 할 수 있도록 도와줌.부트스트랩의 주요 개념리샘플링(Resampling): 주어진 표본 데이터에서 반복적으로 샘플을 복원 추출하여 새로운 표본을 여러 번 생성하는 과정. 이때 각 리샘플은 원본 데이터와 동일한 크기로 생성됨.추정량의 분포: 리샘플링을 통해 얻은 각 샘플에서 통계량(평균, 분산 등)을 계산하여 그 분포를 구할 수 있음. 이를 통해 표본 통계량의 신뢰구간, 표준 오차 등을 추정할 수 있음.비모수적 방법: 부트스트랩은..

[통계] 이항분포(Binomial Distribution)
Data Analysis2024. 9. 23. 00:38[통계] 이항분포(Binomial Distribution)

이항분포 (Binomial Distribution)1. 이항분포란?이항분포는 성공과 실패 두 가지 결과만 존재하는 실험을 여러 번 시행할 때, 각 시행에서 성공할 확률을 모델링하는 확률 분포임. 각 시행은 서로 독립적이며, 시행의 결과가 이항(두 가지 결과) 중 하나로 나타남.예를 들어, 동전을 10번 던졌을 때 앞면이 나오는 횟수를 구하는 문제에서 동전 던지기는 성공(앞면)과 실패(뒷면)로 나뉨. 이러한 상황에서 이항분포를 사용하여 앞면이 나오는 확률을 계산할 수 있음.2. 이항분포의 특징이항분포는 다음 네 가지 조건을 충족해야 함.시행 횟수가 정해져 있어야 함. (n번 시행) 각 시행은 독립적이어야 함. 한 번의 결과가 다른 시행에 영향을 미치지 않아야 함. 각 시행의 결과는 성공 또는 실패 두 ..

[DB] django 에서 다대다(Many-to-Many) 관계 예시
DB2024. 9. 16. 02:28[DB] django 에서 다대다(Many-to-Many) 관계 예시

Django 다대다(Many-to-Many) 관계 예시1. 서론이번 포스트 Django에서 다대다(Many-to-Many) 관계를 사용하는 모델의 예시입니다.팀프로젝트를 하다가 데이터베이스를 설계?를 하려다보니 잘 모르는 부분이라 우선 정리를 해봅니다.이 예시는 강의(Lecture)와 키워드(Keyword) 간의 다대다 관계를 정의한 것입니다. 한 강의는 여러 키워드를 가질 수 있고, 하나의 키워드는 여러 강의에 연결될 수 있습니다.Keyword 모델class Keyword(models.Model): keyword = models.CharField(max_length=255) # 키워드Keyword 모델은 키워드를 나타냅니다. keyword 필드는 각 키워드를 저장하는 문자열 필드입니다.이 모델은..

image