RAG는 어떤 단계로 동작할까: 수집·청킹·임베딩·검색·답변

RAG(Retrieval-Augmented Generation)는 AI가 답변을 생성할 때, 외부 문서를 함께 참고하도록 설계된 구조입니다.
단순히 모델 내부 지식에 의존하는 방식과 달리, RAG는 필요한 정보를 먼저 찾아온 뒤 그 내용을 바탕으로 답변을 생성합니다. 이 글에서는 RAG가 실제로 어떤 단계들을 거쳐 동작하는지, 전체 흐름을 중심으로 설명합니다.

Table of Contents

1️⃣ 수집: 참고할 문서를 모으는 단계

RAG의 출발점은 정보 수집입니다.
AI가 참고할 문서, 데이터, 텍스트 자료를 미리 확보하는 과정입니다.

이 단계에서는 사내 문서, 매뉴얼, 보고서, 웹 문서 등
답변의 근거가 될 수 있는 자료들이 대상이 됩니다.
중요한 점은, 이 자료들이 모델 학습에 포함되는 것이 아니라, 별도의 참고 자료로 관리된다는 점입니다.

2️⃣ 청킹: 문서를 나누는 이유

수집된 문서는 그대로 사용되지 않습니다.
문서 전체를 한 번에 처리하기에는 길이가 길고,
필요한 정보가 문서의 일부에만 존재하는 경우가 많기 때문입니다.

이 때문에 문서는 청킹(chunking) 과정을 거쳐
의미 단위의 작은 조각으로 나뉩니다.
청킹은 이후 검색 정확도와 직접적으로 연결되는 중요한 단계입니다.

3️⃣ 임베딩: 의미를 숫자로 바꾸는 과정

청킹된 텍스트는 다시 임베딩(embedding) 과정을 거칩니다.
임베딩은 텍스트의 의미를 고정된 길이의 숫자 벡터로 변환하는 작업입니다.

이 숫자 벡터는 단순한 글자 비교가 아니라,
의미적 유사성을 계산하기 위해 사용됩니다.
비슷한 내용을 가진 문장은 벡터 공간에서도 가까운 위치에 놓이게 됩니다.

4️⃣ 검색: 질문과 가장 가까운 조각 찾기

사용자가 질문을 입력하면,
질문 역시 임베딩 벡터로 변환됩니다.
이후 질문 벡터와 가장 가까운 문서 벡터들을 찾아내는 과정이 이루어집니다.

이 단계가 바로 검색(retrieval) 입니다.
RAG에서의 검색은 키워드 일치가 아니라,
의미 기반 유사도 검색이라는 점이 핵심입니다.

5️⃣ 답변 생성: 찾은 정보를 바탕으로 설명하기

검색을 통해 관련 문서 조각들이 선택되면,
이 정보들은 AI 모델의 입력으로 함께 전달됩니다.

AI는 이 참고 자료를 바탕으로,
질문에 대한 답변을 문장 형태로 생성합니다.
이때 AI는 정보를 새로 만들어내기보다,
제공된 자료를 중심으로 설명을 구성합니다.

RAG 구조의 의미

RAG는 AI가 모든 지식을 내부에 가지고 있으려는 방식이 아닙니다.
필요한 정보는 외부에서 가져오고,
AI는 그 정보를 이해하고 설명하는 역할에 집중합니다.

이 구조 덕분에 RAG는

최신 정보 반영
특정 문서 기반 답변
근거 있는 설명

이 필요한 환경에서 활용됩니다.

정리

RAG는 수집 → 청킹 → 임베딩 → 검색 → 답변이라는
명확한 단계적 구조로 동작합니다.
각 단계는 서로 독립적이면서도, 전체 품질에 영향을 미칩니다.

이 흐름을 이해하면,
RAG가 왜 기존 AI 답변 방식과 다른 결과를 만들어내는지도
자연스럽게 설명할 수 있습니다.