[AI] AI 에이전트 (Agent)
개요
- LLM이 자율적으로 목표를 달성하기 위해 추론하고 도구를 사용하는 시스템
- 단순 Q&A를 넘어 계획 수립 → 도구 실행 → 결과 반영을 반복
- 2025~2026년 LLM 애플리케이션 발전의 핵심 트렌드
핵심 구성 요소
- 플래너 (Planner): 목표를 달성하기 위한 단계 계획 수립
- 메모리 (Memory)
- 단기 메모리: 컨텍스트 윈도우 (현재 대화 기록)
- 장기 메모리: 외부 저장소 (Vector DB, 파일, DB)
- 도구 (Tools): 웹 검색, 코드 실행, API 호출, 파일 읽기쓰기, 컨텍스트 검색
- 실행기 (Executor): 계획에 따라 도구를 실제 호출
ReAct 패턴
- Reason + Act: 생각(Thought) → 행동(Action) → 관찰(Observation) 반복
-
각 단계에서 LLM이 다음 행동을 결정하고, 도구 실행 결과를 지식으로 활용
사용자: “오늘 서울 날씨 알려줘”
Thought: 날씨 정보가 필요함. search_tool을 사용하자. Action: search_tool(“2026-03-20 서울 날씨”) Observation: “서울 파로 온도 12도” Thought: 답변을 준비할 수 있다. Answer: “오늘 서울은 파로하며 12도입니다.”
에이전트 유형
단일 에이전트 (Single Agent)
- 하나의 LLM이 쪼, 도구, 메모리를 모두 담당
- 상대적으로 단순한 작업에 적합
멀티 에이전트 (Multi-Agent)
- 역할이 다른 여러 에이전트가 협력하여 복잡한 목표 달성
- 오케스트레이터 에이전트: 어떤 에이전트에게 어떤 태스크를 위임할지 결정
- 입력 제한: 에이전트 간 메시지 전달 등의 신뢰 문제
주요 프레임워크
| 프레임워크 | 특징 |
|---|---|
| LangGraph | LangChain 기반 그래프 에이전트, 상태 마신 |
| AutoGen (Microsoft) | 멀티 에이전트 대화 자동화 |
| CrewAI | 역할 기반 멀티 에이전트 |
| OpenAI Agents SDK | 도구 호출 + 핸드오프 특화 |
| Pydantic AI | Python 타입 상슬 에이전트 |
사용 사례
- 코드 작성 에이전트: Claude Code, GitHub Copilot Workspace
- 리서치 에이전트: 웹 검색 + 노트 작성 자동화
- ChatGPT GPTs: 커스텀 엔드포인트 + 도구 연동
- Claude Computer Use: 컴퓨터 조작 자동화
- 자동화 워크플로: 업무 담당 버튼 클릭, 양식 작성 자동화