RAG 구현 가이드 — 검색 증강 생성의 실전 적용
외부 데이터로 LLM 응답을 강화하는 RAG 패턴 구현 방법.
외부 데이터로 LLM 응답을 강화하는 RAG 패턴 구현 방법.
RAG란?
RAG(Retrieval-Augmented Generation)은 LLM이 답변할 때 외부 데이터를 검색해서 참조하는 패턴입니다. 모델을 재학습하지 않고도 최신 정보나 내부 문서 기반 답변이 가능해집니다.
기본 아키텍처
RAG의 흐름: 문서 → 청킹 → 임베딩 → 벡터 DB 저장 → 질문 시 유사 문서 검색 → LLM에 컨텍스트로 전달 → 답변 생성. 벡터 DB로는 Pinecone, Weaviate, Chroma 등을 사용합니다.
실전 팁
RAG 품질을 높이는 핵심: 청킹 전략(너무 크면 노이즈, 너무 작으면 맥락 손실), 하이브리드 검색(벡터 + 키워드), 리랭킹(검색 결과 재정렬).
RAG검색증강벡터DB임베딩LLM