토니의 연습장

Transformer vs LLaMA 모델 비교 본문

AI 일반/모델, 아키텍처, 구현

Transformer vs LLaMA 모델 비교

bellmake 2025. 6. 17. 20:09

 

- Grouped Multi-Query Attention

- KV Cache