토니의 연습장
Multimodal 분기 처리 본문

-> Right : <GEN> 과 <h></h> 를 이용하여 LLM 의 in-context prompt generation 을 하고,
해당 <h> 를 보고 이미지 생성으로 분기 처리하도록 구현됨
'언어 AI (NLP) > Multimodal (MLLM, LMM)' 카테고리의 다른 글
| MLLM - Towards Zero-Shot Anomaly Detection and Reasoning with MLLMs (0) | 2025.09.09 |
|---|---|
| Text-to-Image (0) | 2025.08.08 |
| Multimodal LoRA (0) | 2025.07.23 |
| BLIP / CLIP (3) | 2025.07.17 |
| MLLM 구현 (0) | 2025.05.26 |
