언어 AI (NLP)/LLM & RAG
RAG 주의점 (Document Loader)
bellmake
2025. 1. 21. 15:42
추가 참고 자료 : pdf로부터 표의 구조를 반영하면서 텍스트를 추출할 수 있는 좋은 방법은 바로 "마크다운" 방식 활용입니다.
[RAG] Document Loader 비교 (feat. PDF, Markdown 변환)
0. Document Loader (PDF)RAG를 하려면 수 많은 Raw Data들을 파싱해야 합니다.Raw Data들 중에서도 가장 범용적으로 사용되는 파일은 PDF이기 때문에, 이번 글에서는 PDF 파일에서 한글을 추출해내는 것이 중
mz-moonzoo.tistory.com