패스트캠퍼스환급챌린지

패스트캠퍼스 환급챌린지 9일차 : 파인튜닝과 RAG로 완성하는 맞춤형 LLM 서비스 개발 강의 후기

네모몽 2025. 7. 9. 08:00

 본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다. ※


 

오늘은 LLM의 대표적인 응용 구조인 RAG(Retrieval-Augmented Generation)에 대해 학습했습니다.
GPT나 LLaMA 같은 대형 언어 모델은 기본적으로 방대한 데이터를 학습했지만,
그 지식은 업데이트가 어렵고, 특정 도메인에서는 힘을 못쓰는 경우가 있을 수 있습니다.
이런 한계를 극복하기 위한 방법 중 하나가 바로 RAG 구조입니다.

 

🔍 임베딩이란?

RAG를 이해하기 위해 먼저 임베딩(Embedding)의 개념을 알아두면 좋을 것 같습니다.

임베딩이란, 텍스트를 AI가 이해할 수 있도록 벡터(Vector)로 바꾸는 과정입니다.
예를 들어 "여행 가고 싶다"라는 문장을 숫자의 나열 [0.54, 0.92, ...] 같은 형태로 변환하죠.

이렇게 변환된 벡터는 문장 간의 의미 유사도수치화할 수 있게 해줍니다.
즉, 유사한 의미의 문장은 벡터 공간에서 서로 가까운 거리에 위치하게 되며, 이를 바탕으로 얼마나 유사한지를 파악할 수 있게 되는 것이죠.
대표적인 유사도 계산 방식으로는 코사인 유사도, 내적, L2 거리 등이 있습니다.

 

🔗 왜 임베딩을 하나요?

임베딩을 하면 텍스트 간의 유사도를 정량적으로 비교할 수 있기 때문에, 자연스럽게 검색기(search engine)를 만들 수 있게 됩니다.
검색 대상 문서들을 벡터로 저장해두고, 사용자의 질문을 벡터로 변환한 후, 장 유사한 문서를 찾아서 다시 언어 모델에게 넘겨주는 방식입니다.

이 구조가 바로 RAG(Retrieval-Augmented Generation)입니다.

 

🤖 RAG의 정의

RAG는 말 그대로 검색(Retrieval)을 통해 생성(Generation)을 증강(Augmented)/보완하는 구조입니다.

  • 사용자의 질문을 벡터로 변환
  • Vector DB에 저장된 문서들 중 가장 유사한 문서를 검색
  • 그 문서 내용을 기반으로 LLM이 답변 생성

이 방식을 사용하면 내 문서 기반의 챗봇, 사내 지식 검색 시스템, 할루시네이션 감소 등의 효과를 얻을 수 있게 되죠.
특히 RAG는 모델을 파인튜닝하지 않고도 정확도를 높이는 현실적인 방법입니다.



여러분들은 사내 데이터나 문서 기반으로 RAG 구조를 도입해보신 경험이 있으신가요?
저는 아직 도입 경험이 없어 와닿는 부분이 많지는 않네요.

댓글로 여러분들의 경험을 공유해주세요! 😉

 

📌 오늘의 정리

  • 임베딩은 문장을 벡터로 바꾸는 과정으로, 텍스트 간 유사도 계산이 가능해집니다.
  • RAG는 벡터 검색을 통해 외부 지식을 찾아와, LLM이 그것을 바탕으로 답변을 생성하는 구조입니다.
  • 파인튜닝 없이도 도메인 특화 챗봇, 문서 QA 시스템 등을 구축할 수 있습니다.
  • 벡터DB는 사용 목적과 데이터 크기에 따라 Qdrant, FAISS 등 다양한 선택지가 존재합니다.

 

① 오늘자 날짜, 공부 시작, 종료 시각 포함 사진 각 1장

패스트캠퍼스_LLM 서비스개발_9일차_공부시작/종료시간

 

 1개 클립 수강 인증 사진 1장 / 학습 인증 사진 1장

패스트캠퍼스_LLM서비스개발_9일차_수강인증/학습인증

 

 챌린지 대상 강의 완강률 캡쳐 사진 1장

패스트캠퍼스_LLM서비스개발_9일차_완강률캡처

 


 

https://fastcampus.info/4n8ztzq

 

(~6/20) 50일의 기적 AI 환급반💫 | 패스트캠퍼스

초간단 미션! 하루 20분 공부하고 수강료 전액 환급에 AI 스킬 장착까지!

fastcampus.co.kr