토니의 연습장

Transformer vs LLaMA 모델 비교 본문

AI 일반/모델, 아키텍처, 구현

Transformer vs LLaMA 모델 비교

bellmake 2025. 6. 17. 20:09

 

- Grouped Multi-Query Attention

- KV Cache

 

'AI 일반 > 모델, 아키텍처, 구현' 카테고리의 다른 글

실무에서의 Embedding 모델 종류 (Text Embedding)  (0) 2025.07.17
pytorch 구현함수 내부  (0) 2025.06.17
LayerNorm 과 BatchNorm  (1) 2025.05.28
causal mask  (1) 2025.05.28
Model workflow  (1) 2025.01.14