토니의 연습장
RAG 주의점 (Document Loader) 본문
추가 참고 자료 : pdf로부터 표의 구조를 반영하면서 텍스트를 추출할 수 있는 좋은 방법은 바로 "마크다운" 방식 활용입니다.
[RAG] Document Loader 비교 (feat. PDF, Markdown 변환)
0. Document Loader (PDF)RAG를 하려면 수 많은 Raw Data들을 파싱해야 합니다.Raw Data들 중에서도 가장 범용적으로 사용되는 파일은 PDF이기 때문에, 이번 글에서는 PDF 파일에서 한글을 추출해내는 것이 중
mz-moonzoo.tistory.com
'언어 AI (NLP) > LLM & RAG & Agent' 카테고리의 다른 글
ollama 참고 (1) | 2025.01.23 |
---|---|
Embedding - 개인 자원 고려하기 (2) | 2025.01.23 |
Memory (3) | 2025.01.14 |
HyDE 와 Re-ranking (2) | 2025.01.09 |
LangServe example (6) | 2025.01.09 |