토니의 연습장

Multimodal 분기 처리 본문

언어 AI (NLP)/Multimodal (MLLM, LMM)

Multimodal 분기 처리

bellmake 2025. 7. 23. 15:36

-> Right : <GEN> 과 <h></h> 를 이용하여 LLM 의 in-context prompt generation 을 하고,

    해당 <h> 를 보고 이미지 생성으로 분기 처리하도록 구현됨

'언어 AI (NLP) > Multimodal (MLLM, LMM)' 카테고리의 다른 글

MLLM - Towards Zero-Shot Anomaly Detection and Reasoning with MLLMs  (0) 2025.09.09
Text-to-Image  (0) 2025.08.08
Multimodal LoRA  (0) 2025.07.23
BLIP / CLIP  (3) 2025.07.17
MLLM 구현  (0) 2025.05.26