토니의 연습장

RAG 주의점 (Document Loader) 본문

언어 AI (NLP)/LLM & RAG & Agent

RAG 주의점 (Document Loader)

bellmake 2025. 1. 21. 15:42

 

(출처)

추가 참고 자료 : pdf로부터 표의 구조를 반영하면서 텍스트를 추출할 수 있는 좋은 방법은 바로 "마크다운" 방식 활용입니다.

 

[RAG] Document Loader 비교 (feat. PDF, Markdown 변환)

0. Document Loader (PDF)RAG를 하려면 수 많은 Raw Data들을 파싱해야 합니다.Raw Data들 중에서도 가장 범용적으로 사용되는 파일은 PDF이기 때문에, 이번 글에서는 PDF 파일에서 한글을 추출해내는 것이 중

mz-moonzoo.tistory.com

 

 

 

 

 

'언어 AI (NLP) > LLM & RAG & Agent' 카테고리의 다른 글

ollama 참고  (1) 2025.01.23
Embedding - 개인 자원 고려하기  (2) 2025.01.23
Memory  (3) 2025.01.14
HyDE 와 Re-ranking  (2) 2025.01.09
LangServe example  (6) 2025.01.09