| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
Tags
- odds
- qwen
- Document Augmentation
- SFT
- retrieval
- DyPRAG
- Algorithm
- Baekjoon
- COT
- Noise Robustness
- Transformer
- DPO
- GPT
- Statistics
- Hallucination
- Parametric RAG
- coding test
- Retriever
- LLM
- 파인튜닝
- fine-tuning
- Python
- RAG
- NLP
- moe
- Noise
- lora
- Embedding
- reranking
- Do it
Archives
- Today
- Total
목록Unanswerable (1)
왕구아니다
본 논문 리뷰는 저의 개인적인 해석과 의견을 바탕으로 작성된 글입니다.내용 중 해석의 오류나 개념적인 착오가 있다면, 망설이지 마시고 댓글로 혼내주시면 감사하겠습니다~Preview- FactGuard는 장문 문맥(Long-context) 환경에서 LLM이 답할 수 없는 질문에 대해 환각을 생성하는 문제를 해결하기 위해, answerable과 현실적인 unanswerable 질문을 자동으로 생성하는 협업적 다중 작업 프레임워크를 제안- 이를 통해 구축된 FactGuard-Bench(25,220개 예시)는 4K~128K 길이의 문맥에서 모델이 “답할 수 없음”을 추론 기반으로 설명하며 거부하는 능력을 평가하도록 설계되었으며, 실험 결과 기존 LLM들은 answerable과 unanswerable 사이에 큰 ..
Paper Review/Synthetic Dataset
2026. 2. 24. 00:22
