IBM RAG and Agentic AI: Build Next-Gen AI Assistants 2일차
생성형 AI 관련 단어 정리
Foundational Concepts
| 용어 | 정의 | 예시 |
| LLM | 방대한 양의 텍스트 데이터 기반으로 훈련된 생성형 AI 모델의 한 종류 |
GPT, LLaMA, Claude |
| 프롬프트 | LLM 출력을 안내하기 위한 텍스트 | "3문장으로 요약해줘" |
| 프롬프트 템플릿 | 동적 입력을 위한 placehoders가 있는 재사용 가능한 구조적 프롬프트 |
Explain {prompt} like ~~ |
| RAG (Retrieval-Augmented Generation) |
외부 지식 출처에서 검색한 정보를 LLM과 결합해 정확도를 높이고 hallucination을 줄이는 방법 |
실시간 데이터로 질문 대답 |
| Retriever | 데이터셋이나 DB에서 정보를 가져오도록 설계된 요소 | FAISS, Elasticsearch 등을 이용한 벡터 유사도 검색 |
| Agent | 특정 툴을 사용해 계획, 추론, 실행하는 자율 AI | AutoGPT, Langchain Agent |
| Multi Agent System | 여러 Agent를 혼용하여 복잡한 작업 해결하는 프레임워크 | Microsoft AutoGen |
| CoT(Chain of Thought) | 모델이 단계별로 문제를 분해하도록 유도하는 기법 | "~~를 단계별로 해결해보자" |
| 환각 완화 | LLM의 Hallucination을 줄이기 위한 전략 | RAG, 파인튜닝, 프롬프트 제약 |
| Vector_DB | 벡터 임베딩을 저장하고 쿼리하는 데 최적화 된 DB | Pinecone, Chroma_db, Weaviate |
| Orchestration | 여러 AI 구성 요소가 포함된 워크플로우를 관리하고 조정하는 도구 | Langchain, LlamaIndex |
| Finetuning | 특정 작업을 위해 도메인 특화 데이터를 사용해 사전 훈련된 모델을 조정 |
LoRA, QLoRA |
모델 개발 및 배포를 위한 도구
Hugging Face, LangChain, AutoGen, CrewAI, BeeAI, LlamaIndex, LangGraph
검색 및 인프라
FAISS
- 밀집 벡터의 유사성 검색을 위한 라이브러리
- RAG를 위한 Top-k 개의 문서 검색Pinecone
- Vector_db 작업을 위한 관리형 클라우드 서비스
- 실시간 검색을 위한 임베딩 저장Haystack
- RAG 파이프라인 구축을 위한 엔드 투 엔드 프레임워크
- 기업 검색 시스템 배포 등
프롬프팅 기법
Few-shot
- 모델의 출력 형식을 안내하기 위해 프롬프트에 예시를 제공하는 것
- "AAA를 프랑스어로 번역해줘, 예시 : 안녕하세요 -> Bonjour"Zero-shot
- 예시 없이 모델에게 작업을 수행하도록 직접 요청
RAG란?
- Retrivel(검색) + Augmentation(증강) + Generation(생성)
- Retrieval : 컨텍스트를 위해 벡터 DB에서 검색
- Augmentation : 사용자 프롬프트와 리트리버 결과를 결합
- Generation : LLM이 최종 출력을 생성
반응형
'AI 관련 지식 > 학습 내용' 카테고리의 다른 글
| [Coursera] IBM RAG and Agentic AI: Build Next-Gen AI Assistants - LCEL과 f-string (0) | 2025.11.06 |
|---|---|
| [Coursera] IBM RAG and Agentic AI: Build Next-Gen AI Assistants 2일차 - 프롬프트 엔지니어링의 중요성 (0) | 2025.11.04 |
| [Coursera 강의] IBM RAG and Agentic AI: Build Next-Gen AI Assistants 1일차 (1) | 2025.10.21 |
| [LLM 이론] 2. LLM 기초 지식 (0) | 2025.10.02 |
| [LLM 이론] 1. Transformer (0) | 2025.10.02 |