[Coursera] IBM RAG and Agentic AI: Build Next-Gen AI Assistants 2일차 - RAG 관련 용어 정리

IBM RAG and Agentic AI: Build Next-Gen AI Assistants 2일차

생성형 AI 관련 단어 정리

Foundational Concepts

용어 정의 예시
LLM 방대한 양의 텍스트 데이터 기반으로 훈련된
생성형 AI 모델의 한 종류
GPT, LLaMA, Claude
프롬프트 LLM 출력을 안내하기 위한 텍스트 "3문장으로 요약해줘"
프롬프트 템플릿 동적 입력을 위한 placehoders가 있는 재사용 가능한
구조적 프롬프트
Explain {prompt} like ~~
RAG
(Retrieval-Augmented
Generation)
외부 지식 출처에서 검색한 정보를 LLM과 결합해 정확도를 높이고
hallucination을 줄이는 방법
실시간 데이터로 질문 대답
Retriever 데이터셋이나 DB에서 정보를 가져오도록 설계된 요소 FAISS, Elasticsearch 등을 이용한 벡터 유사도 검색
Agent 특정 툴을 사용해 계획, 추론, 실행하는 자율 AI AutoGPT,
Langchain Agent
Multi Agent System 여러 Agent를 혼용하여 복잡한 작업 해결하는 프레임워크 Microsoft AutoGen
CoT(Chain of Thought) 모델이 단계별로 문제를 분해하도록 유도하는 기법 "~~를 단계별로
해결해보자"
환각 완화 LLM의 Hallucination을 줄이기 위한 전략 RAG, 파인튜닝, 프롬프트 제약
Vector_DB 벡터 임베딩을 저장하고 쿼리하는 데 최적화 된 DB Pinecone, Chroma_db, Weaviate
Orchestration 여러 AI 구성 요소가 포함된 워크플로우를 관리하고 조정하는 도구 Langchain, LlamaIndex
Finetuning 특정 작업을 위해 도메인 특화 데이터를 사용해
사전 훈련된 모델을 조정
LoRA, QLoRA

모델 개발 및 배포를 위한 도구

Hugging Face, LangChain, AutoGen, CrewAI, BeeAI, LlamaIndex, LangGraph

검색 및 인프라

FAISS

  • 밀집 벡터의 유사성 검색을 위한 라이브러리
  • RAG를 위한 Top-k 개의 문서 검색Pinecone
  • Vector_db 작업을 위한 관리형 클라우드 서비스
  • 실시간 검색을 위한 임베딩 저장Haystack
  • RAG 파이프라인 구축을 위한 엔드 투 엔드 프레임워크
  • 기업 검색 시스템 배포 등

프롬프팅 기법

Few-shot

  • 모델의 출력 형식을 안내하기 위해 프롬프트에 예시를 제공하는 것
  • "AAA를 프랑스어로 번역해줘, 예시 : 안녕하세요 -> Bonjour"Zero-shot
  • 예시 없이 모델에게 작업을 수행하도록 직접 요청

RAG란?

  • Retrivel(검색) + Augmentation(증강) + Generation(생성)
  • Retrieval : 컨텍스트를 위해 벡터 DB에서 검색
  • Augmentation : 사용자 프롬프트와 리트리버 결과를 결합
  • Generation : LLM이 최종 출력을 생성
반응형