| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
- reranking
- lora
- Do it
- COT
- LLM
- Baekjoon
- Transformer
- Retriever
- coding test
- Parametric RAG
- odds
- DPO
- moe
- Hallucination
- Embedding
- NLP
- Python
- 파인튜닝
- fine-tuning
- Noise
- Document Augmentation
- Statistics
- qwen
- retrieval
- DyPRAG
- RAG
- GPT
- Algorithm
- SFT
- Noise Robustness
- Today
- Total
목록Statistics (3)
왕구아니다
엄청 딥한 내용보단 용어 정리 느낌으로 포스팅합니다🫡1️⃣ 가설검정의 기본 개념 가설검정은 관측된 데이터(표본)를 통해 모집단에 대한 주장(가설)을 기각할지 채택할지 결정하는 의사결정 규칙을 만드는 과정입니다.1.1 가설의 종류와 검정의 원리귀무가설(H0, Null Hypothesis): 기존의 사실이나 무의미한 상태를 나타냅니다. (예: 𝜃 = 1500) "Null"은 '차이가 없다', '효과가 없다'는 의미를 내포합니다.대립가설(H1, Alternative Hypothesis): 입증하고자 하는 새로운 주장입니다. (예: 𝜃 > 1500)검정통계량(Test Statistic): 검정의 기준이 되는 통계량입니다. 기각역(Critical Region): 검정통계량의 관측값이 이 영역에 속하면 H0를..
📝 "Alan Agresti의 "을 기반으로 공부한 내용을 정리한 포스팅입니다!4️⃣ 로지스틱 회귀데이터 분석을 하다 보면 반응변수(Y)가 연속형이 아닌 범주형(Categorical)인 경우를 흔히 마주합니다. '성공/실패', '질병 유/무', '구매/비구매' 처럼 말이죠. 이때 가장 표준적으로 사용되는 방법이 바로 로지스틱 회귀입니다.1. 왜 선형 회귀가 아닌 로지스틱 회귀인가?반응변수 Y가 0(실패) 또는 1(성공)의 값을 갖는 이항변수라고 가정해 봅시다. 설명변수 x에 따른 Y=1일 확률을 π(x)라고 할 때, 우리가 흔히 아는 선형 확률 모형(Linear Probability Model)을 적용하면 다음과 같습니다.하지만 이 모형은 치명적인 구조적 결함이 있습니다.확률의 범위 위반: x가 매우 ..
📝 "Alan Agresti의 "을 기반으로 공부한 내용을 정리한 포스팅입니다!1️⃣ 범주형 자료와 추론의 기초1. 반응변수의 척도 (Scale)분석 방법을 결정하는 가장 첫 단계는 자료의 형태를 파악하는 것입니다.명목형 (Nominal): 순서가 없는 범주 (예: 혈액형, 선호하는 정당)순서형 (Ordinal): 순서가 있는 범주 (예: 환자의 회복 정도, 설문조사의 만족도)Tip: 순서형 자료를 명목형처럼 분석하면 검정력이 떨어지므로 주의해야 합니다.2. 확률 분포 (Probability Distributions)범주형 자료분석의 핵심 분포는 두 가지입니다.이항 분포 (Binomial Distribution): 범주가 2개(성공/실패)일 때 사용합니다. n번의 시행 중 성공 횟수의 분포입니다.다항 ..
