토니의 연습장
GPT/Llama 아키텍처 본문
'AI 일반 > 모델, 아키텍처, 구현' 카테고리의 다른 글
| Pretrain, SFT, RL (0) | 2025.11.17 |
|---|---|
| MoE (Mixture of Experts) (0) | 2025.11.15 |
| LLM train/eval/generate 간단한 예시 (0) | 2025.09.18 |
| RLHF / DPO (ft. Pretrained -> SFT -> Reward -> Final model) (0) | 2025.09.05 |
| SSL (Self-Supervised Learning) (1) | 2025.08.26 |

