Hermes Agent 완벽 가이드: 스스로 진화하는 AI 에이전트 프레임워크
Hermes Agent 완벽 가이드: 스스로 진화하는 AI 에이전트 프레임워크
대부분의 AI 에이전트는 세션이 끝나면 모든 맥락을 잃습니다. 어제 3시간 동안 학습시킨 내용이 오늘 아침 리셋되는 경험, 해보셨을 겁니다. Hermes Agent는 이 근본적인 문제를 해결하기 위해 탄생한 자기 진화형 오픈소스 AI 에이전트 프레임워크입니다.
Hermes Agent는 Nous Research가 개발한 MIT 라이선스 오픈소스 AI 에이전트로, 경험으로부터 스킬을 생성하고 크로스 세션 영구 메모리로 사용자 모델을 구축하는 자기 학습 루프(Self-Improving Loop)를 핵심 차별점으로 합니다.
Hermes Agent란 무엇인가
Hermes Agent는 2026년 2월 25일 Nous Research가 출시한 자율 AI 에이전트입니다. "The agent that grows with you"라는 슬로건답게, 사용할수록 사용자의 작업 패턴을 학습하고 반복 작업을 자동화하는 스킬을 스스로 생성합니다.
출시 직후 GitHub 트렌딩 1위를 기록했으며, 현재 10,000개 이상의 스타와 1,600개 이상의 포크를 달성했습니다. Hermes-3 모델 패밀리(Llama 3.1 기반, Atropos RL 프레임워크로 파인튜닝) 위에 구축되어 도구 호출 정확도와 장거리 계획 수립에 최적화되어 있습니다.
핵심 특징 요약:
| 항목 | 내용 |
|---|---|
| 라이선스 | MIT (완전 오픈소스) |
| 출시일 | 2026년 2월 25일 |
| 최신 버전 | v0.4.0 (2026.3.23) |
| 지원 모델 | 200+ (OpenRouter, OpenAI, Anthropic, 로컬) |
| 터미널 백엔드 | 6종 (Local, Docker, SSH, Daytona, Singularity, Modal) |
| 메시징 플랫폼 | 9종 (Telegram, Discord, WhatsApp, Signal 등) |
아키텍처: 3-Tier 설계와 ReAct 루프
Hermes Agent의 아키텍처는 세 개의 계층으로 구성됩니다.
사용자 인터페이스 계층
CLI, Gateway(메시징 플랫폼), ACP(에디터 통합), Cron(스케줄링)을 통해 사용자와 상호작용합니다. 9개 메시징 플랫폼이 단일 게이트웨이 프로세스에서 실행되어 운영 복잡도를 최소화합니다.
코어 에이전트 로직
중심에는 AIAgent 클래스가 있습니다. run_conversation(user_message, conversation_history) 메서드가 핵심 진입점이며, ReAct(Reasoning and Acting) 루프를 통해 Observation(관찰) → Reasoning(추론) → Action(실행)을 순환합니다.
while api_call_count < self.max_iterations and self.iteration_budget.remaining > 0:
response = client.chat.completions.create(model=model, messages=messages, tools=tool_schemas)
if response.tool_calls:
for tool_call in response.tool_calls:
result = handle_function_call(tool_call.name, tool_call.args, task_id)
messages.append(tool_result_message(result))
실행 백엔드 계층
6개 터미널 백엔드를 제공하여 로컬 머신부터 클라우드 서버리스까지 유연하게 선택할 수 있습니다.
| 백엔드 | 특징 | 적합한 용도 |
|---|---|---|
| Local | 호스트 머신 직접 실행 | 개발/테스트 |
| Docker | 격리된 재현 가능 환경 | CI/CD, 안전한 실험 |
| SSH | 원격 서버 접속 | 서버 관리 |
| Daytona | 서버리스 + 하이버네이트 | 비용 최적화 |
| Singularity | HPC 컨테이너 | 연구/과학 계산 |
| Modal | 서버리스 (유휴 비용 ~0) | 간헐적 대규모 작업 |
핵심 기능: 자기 학습 루프(Self-Improving Loop)
Hermes Agent의 가장 독특한 기능은 자기 학습 루프입니다. 4단계 순환으로 동작합니다.
1단계 - 스킬 자동 생성: 동일한 도구를 5회 이상 호출하거나 복잡한 에러를 수정하면, 에이전트가 해당 절차를 Python 기반 스킬로 자동 합성합니다.
2단계 - 스킬 넛지(Nudge): 설정된 주기로 "방금 완료한 작업을 스킬로 저장하라"는 알림이 프롬프트에 추가됩니다.
3단계 - 스킬 개선: 사용 중 실패나 비효율이 발견되면 스킬을 자동으로 개선합니다.
4단계 - 영구 저장: ~/.hermes/skills/에 agentskills.io 오픈 표준 형식으로 저장됩니다.
다층 메모리 시스템
Hermes Agent는 5개 레이어의 메모리 시스템을 운영합니다.
| 계층 | 메커니즘 | 지속성 | 용도 |
|---|---|---|---|
| MEMORY.md | 마크다운 파일 | 영구 | 검색 가능한 지식 저장 |
| USER.md | 사용자 모델 | 영구 | 선호, 작업 스타일 학습 |
| Honcho | AI 네이티브 듀얼 피어 | 영구 (크로스 세션) | 사용자 피어 + AI 피어 |
| SessionDB | SQLite (FTS5) | 영구 | 세션 저장소 + 전문 검색 |
| 대화 컨텍스트 | 메시지 + 압축 | 세션 | 현재 대화 맥락 |
특히 Honcho 통합은 사용자 피어(선호/목표/소통 스타일 학습)와 AI 피어(에이전트 지식 구축)의 듀얼 피어 아키텍처를 제공합니다.
Self-Evolution: GEPA와 DSPy
별도 레포(hermes-agent-self-evolution)로 제공되는 진화적 자기 개선 시스템은 Hermes Agent를 더욱 특별하게 만듭니다.
- GEPA(Genetic-Pareto Prompt Evolution): ICLR 2026 Oral 논문 기반의 프롬프트 진화 알고리즘
- GPU 훈련 불필요: API 호출만으로 최적화 가능 (1회 비용 $2-10)
- 자동 진단: 실행 트레이스(에러 메시지, 프로파일링, 추론 로그)를 분석하여 실패 원인 파악
- 자동 PR 생성: 후보 변형 생성 → 평가 → 최고 성능 변형으로 Pull Request 자동 생성
MCP 프로토콜 지원
Model Context Protocol(MCP)을 통해 외부 도구를 연결할 수 있습니다.
- stdio + HTTP/StreamableHTTP 전송 지원
- 시작 시 자동 도구 발견 및 등록
- v0.4.0에서
hermes mcpCLI + OAuth 2.1 PKCE 플로우 추가 - GitHub, DB, 파일 시스템, 브라우저 등 MCP 서버 연결
지원 모델과 프로바이더
벤더 락인 없이 200개 이상의 모델을 hermes model 명령어 하나로 전환할 수 있습니다.
| 프로바이더 | 대표 모델 |
|---|---|
| Nous Portal | Hermes-3 (기본) |
| OpenRouter | 200+ 모델 (GPT-4o, Claude, Gemini 등) |
| Ollama | Llama, Mistral 등 로컬 모델 |
| vLLM / llama.cpp | 고성능 로컬 추론 |
경쟁 프레임워크 비교
2026년 3월은 AI 에이전트 프레임워크의 격전지입니다. LangChain, OpenAI Agents SDK, Google ADK, Anthropic Agent SDK가 한 달 안에 모두 출시/업데이트되었습니다.
| 항목 | Hermes Agent | Claude Code | Cursor | ElizaOS |
|---|---|---|---|---|
| 자기 진화 | O (GEPA + DSPy) | X | X | X |
| 오픈소스 | MIT | 부분 오픈 | 비공개 | MIT |
| 데이터 프라이버시 | 완전 자체 호스팅 | 클라우드 의존 | 클라우드 의존 | 자체 호스팅 |
| 모델 다양성 | 200+ | Claude 전용 | 멀티모델 | 멀티모델 |
| 영구 메모리 | 5계층 | 제한적 | 제한적 | 제한적 |
| 타겟 | 범용 개발자/연구자 | 개발자 | 개발자 | Web3 |
| 운영 비용 | VPS $5/월 가능 | API/구독 | 구독 | VPS 가능 |
Hermes Agent는 자기 진화형 + 완전 오픈소스 + 로컬 우선을 동시에 갖춘 유일한 프레임워크입니다.
v0.4.0 주요 업데이트 (2026.3.23)
최신 릴리스인 v0.4.0은 한 주에 300개 PR이 머지된 대규모 업데이트입니다.
- OpenAI 호환 API 서버 추가
- 6개 신규 메시징 어댑터 (Signal, DingTalk, SMS, Mattermost, Matrix, Webhook)
- MCP 서버 관리 CLI + OAuth 2.1 PKCE
- 게이트웨이 프롬프트 캐싱
- 스트리밍 기본 활성화
- 200개 이상 버그 수정
마무리: Hermes Agent가 적합한 사용자
Hermes Agent는 다음과 같은 사용자에게 최적입니다.
- 터미널 중심 개발자/연구자: CLI 기반 워크플로우를 선호하는 분
- 데이터 프라이버시 중시: 완전 자체 호스팅으로 데이터가 외부로 나가지 않습니다
- 멀티모델 유연성: 단일 벤더 종속 없이 200+ 모델 활용
- 자동화 추구: 반복 작업을 스킬로 자동 전환하고 싶은 분
- 비용 최적화: VPS $5/월로 AI 에이전트 운영 가능
설치는 단 한 줄입니다.
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
AI 에이전트의 미래는 도구에서 파트너로의 전환입니다. Hermes Agent는 그 전환의 최전선에 있습니다.
FAQ
Hermes Agent는 무료인가요?
네, MIT 라이선스 완전 오픈소스입니다. 단, AI 모델 API 비용은 별도입니다. 로컬 모델(Ollama, vLLM)을 사용하면 API 비용도 0원입니다.
Claude Code와 뭐가 다른가요?
Claude Code는 Claude 모델에 특화된 코드 에이전트입니다. Hermes Agent는 200+ 모델을 지원하며, 자기 학습 루프와 5계층 영구 메모리가 핵심 차별점입니다. 코드 품질은 Claude Code가 우세하지만, 확장성과 데이터 프라이버시는 Hermes Agent가 우위입니다.
어떤 모델을 추천하나요?
시작은 Hermes-3(기본)로, 이후 작업 특성에 따라 OpenRouter로 모델을 전환하세요. 코드 작업은 Claude 계열, 범용 작업은 GPT-4o, 로컬 실행은 Llama 계열이 적합합니다.
Self-Evolution은 어떻게 시작하나요?
hermes-agent-self-evolution 레포를 참고하세요. GPU 없이 API 호출만으로 동작하며, 1회 최적화 비용은 약 $2-10입니다.
MCP 서버는 어떻게 연결하나요?
v0.4.0부터 hermes mcp CLI가 추가되었습니다. hermes mcp add <server-name> 명령으로 MCP 서버를 등록하고, OAuth 2.1 PKCE 플로우로 인증합니다.