본문으로 건너뛰기
블로그로 돌아가기
Hermes Agent v0.11.0 완전 분석: 7주 만에 GitHub 별 10만 5천 개를 찍은 자기 개선 AI 에이전트
트렌드

Hermes Agent v0.11.0 완전 분석: 7주 만에 GitHub 별 10만 5천 개를 찍은 자기 개선 AI 에이전트

9분 읽기0

Hermes Agent v0.11.0 완전 분석: 7주 만에 GitHub 별 10만 5천 개를 찍은 자기 개선 AI 에이전트

오픈소스 AI 에이전트 프레임워크 시장에서 Hermes Agent가 2026년 가장 빠른 성장 곡선을 그리고 있습니다. Nous Research가 2026년 2월 25일 처음 공개한 이 프로젝트는 7주 만에 GitHub 별 105,000개를 돌파했고, 2026년 4월 23일 출시된 v0.11.0은 700개 이상의 PR과 200명 가까운 기여자가 참여한 역대 최대 규모 업데이트입니다.

비유하자면 Hermes Agent는 "쓸수록 똑똑해지는 비서"입니다. 사용자가 작업을 시킬수록 본인의 스킬 라이브러리를 자동으로 늘려가고, 다음 비슷한 작업이 들어오면 더 빠르고 정확하게 처리합니다. 이 글에서는 v0.11.0의 핵심 기능, 기반 모델 아키텍처, 그리고 기존 프레임워크 대비 차별점을 분석합니다.

1. v0.11.0 핵심 신기능 (2026-04-23 릴리즈)

이번 릴리즈에서 가장 눈에 띄는 변화는 TUI(터미널 UI) v2 완전 재작성/steer 명령입니다.

React/Ink 기반 TUI v2

기존 터미널 인터페이스는 텍스트 출력 위주였습니다. v0.11에서는 React/Ink 기반으로 완전히 재작성되어 다음을 지원합니다:

  • 스티키 컴포저: 입력창이 화면 하단에 고정되어 긴 출력을 스크롤해도 사라지지 않음
  • OSC-52 클립보드: 터미널에서 코드 블록을 클릭 한 번으로 시스템 클립보드에 복사
  • 라이브 스트리밍: 에이전트의 도구 호출 결과를 실시간으로 화면에 흘려보냄

/steer 명령: 에이전트 실행 중 개입

기존 에이전트 프레임워크는 한 번 실행하면 끝까지 기다려야 했습니다. /steer는 이 흐름을 깨고, 사용자가 에이전트의 다음 도구 호출 직전에 끼어들어 방향을 수정할 수 있게 합니다. 비유하자면 자율주행 자동차의 핸들을 잠깐 잡는 것과 같습니다.

신규 모델 프로바이더 5종 추가

프로바이더용도
GPT-5.5 (Codex OAuth)OpenAI 최신 코딩 모델
AWS Bedrock (Converse API)엔터프라이즈 AWS 인프라 통합
NVIDIA NIMNVIDIA 추론 컨테이너
Arcee AI소형 특화 모델
Vercel ai-gateway멀티 프로바이더 라우팅

QQBot — 17번째 메시지 플랫폼

기존 16개 메시지 플랫폼에 중국 텐센트의 QQBot이 추가되어, 글로벌 메시지 채널 커버리지가 17개로 확대되었습니다.

2. 핵심 차별점: GEPA 자기 개선 엔진

Hermes Agent를 단순 "오픈소스 LLM 래퍼"와 구분 짓는 결정적 요소는 GEPA(Generative Embedding Prompt Adaptation) 알고리즘입니다. ICLR 2026에서 Oral 채택된 이 메커니즘은 다음과 같이 동작합니다.

작동 원리

  1. 태스크 완료: 에이전트가 5개 이상의 도구 호출을 포함한 복잡한 태스크를 마침
  2. 트레이스 분석: GEPA가 실행 트레이스 전체(어떤 툴을 어떤 순서로 호출했는지)를 분석
  3. 스킬 자동 생성: Markdown 파일로 재사용 가능한 스킬 정의 저장
  4. 프롬프트 자동 최적화: 성공한 패턴을 기반으로 시스템 프롬프트 일부를 미세 조정
  5. SQLite FTS5 색인: 과거 경험을 전문 검색이 가능한 형태로 저장

벤치마크 결과

벤치마크Hermes Agent (GEPA)비교 모델차이
MATH 정확도93%기본 CoT: 67%+26pt
AIME-2025MIPROv2 +12%MIPROv2 (선도 프롬프트 최적화)+12%
GEPA vs GRPO평균 +6%, 최대 +20%35배 적은 롤아웃 사용효율 압도
반복 태스크 속도+40%스킬 미축적 시누적 효과

여기서 주목할 점은 반복 태스크에서 40% 속도 향상입니다. 전통적인 LLM 에이전트는 매번 0에서 시작하지만, Hermes Agent는 스킬 라이브러리를 누적하기 때문에 사용량이 늘수록 효율이 올라갑니다.

3. 기반 모델: Hermes 4.3 36B

Hermes Agent의 기본 로컬 모델은 Hermes 4.3 36B입니다. ByteDance Seed 36B 기반의 파인튜닝 모델로, Nous Research의 분산 학습 네트워크인 Psyche로 학습되었습니다.

주요 스펙

  • 파라미터: 36B (Hermes 4 70B의 절반)
  • 컨텍스트 윈도우: 512K 토큰
  • 성능: Hermes 4 70B와 비슷한 수준을 파라미터 절반으로 달성
  • 라이선스: MIT 완전 오픈소스

RefusalBench 결과 — 주목할 만한 수치

RefusalBench는 모델이 정당한 사용자 요청을 부당하게 거절하는 비율을 측정하는 벤치마크입니다.

모델RefusalBench 통과율
Hermes 4.357%+
GPT-4o~17%
Claude~17%

Hermes 4.3는 GPT-4o, Claude 대비 약 3.4배 더 적게 거절합니다. 엔터프라이즈 환경에서 실용적인 작업 자동화에 큰 의미를 가지는 수치입니다.

4. Tool Gateway: API 키 통합 관리 (v0.10에서 도입)

v0.10.0(2026-04-16)에서 추가된 Tool Gateway는 v0.11에서도 핵심 기능으로 자리잡았습니다. 비유하자면 "에이전트용 API 통합 게이트웨이"입니다.

통합되는 도구

카테고리통합 서비스
웹 검색Firecrawl
이미지 생성FAL / FLUX 2 Pro
TTSOpenAI Text-to-Speech
브라우저 자동화Browser Use

Nous Portal 구독자는 위 모든 도구를 별도 API 키 없이 사용할 수 있습니다. 기존에는 에이전트 프로젝트 시작 시 4-5개 서비스에 가입하고 각각 키를 발급받는 과정이 첫 진입 장벽이었는데, Tool Gateway가 이 마찰을 한 번에 해소합니다.

5. 3계층 메모리 시스템

Hermes Agent의 메모리 아키텍처는 인간의 기억 구조를 모방한 3계층입니다.

단기 메모리

  • 범위: 현재 세션 컨텍스트
  • 저장: 인메모리, 컨텍스트 압축 적용
  • 용도: 대화의 즉각적인 흐름 유지

중기 메모리

  • 범위: 세션 간 영속
  • 저장: SQLite (FTS5 전문 검색 인덱스)
  • 용도: 며칠 전 대화 검색, 과거 결정 참조

장기 메모리

  • 범위: 누적 지식 베이스
  • 저장: 스킬 파일, 페르소나 정의, 사용자 프로파일
  • 용도: 에이전트의 "성격"과 "전문성" 형성

이 구조 덕분에 사용자가 1개월 전에 "내 회사 이름은 X야"라고 알려준 정보를 별도 입력 없이 참조할 수 있습니다.

6. 비용 구조 비교: 20-90배 저비용

엔터프라이즈 배포 관점에서 가장 중요한 지표는 동일 작업당 비용입니다. Nous Research가 제시한 비교 결과는 다음과 같습니다.

시나리오Hermes Agent (Hermes 4.3 36B 로컬)GPT-5.5 / Claude 4 (API)
단일 태스크 (5 툴 호출)$0.001$0.02 - $0.09
일일 1,000 태스크$1$20 - $90
월간 비용$30$600 - $2,700

20-90배의 비용 차이가 발생합니다. 더 중요한 점은, 로컬 배포 시 데이터가 외부로 나가지 않기 때문에 금융/의료/정부 같은 규제 산업에서도 안전하게 사용할 수 있다는 것입니다.

7. 다른 프레임워크와의 비교

vs OpenClaw (Anthropic 생태계)

항목Hermes AgentOpenClaw
라이선스MIT 오픈소스상용 API 종속
자기 개선GEPA 자동 학습수동 프롬프트 엔지니어링
모델 선택멀티 프로바이더 (로컬 포함)Claude API 전용
셀프 호스팅가능불가능

vs AutoGPT / CrewAI

기존 오픈소스 에이전트 프레임워크들은 "여러 LLM API를 묶어서 호출하는 오케스트레이터" 수준이었습니다. Hermes Agent의 차별점:

  • 실제 자기 개선: 코드 레벨에서 프롬프트 자동 최적화 (GEPA)
  • 영구 메모리: 세션 종료 후에도 지식 유지 (SQLite FTS5)
  • 소비자 채널 통합: 17개 메시지 플랫폼 직접 연결 (별도 봇 빌더 불필요)

8. 실제 사용 사례

개인 비서

Telegram 또는 Discord 계정 하나만 연결하면 일정 관리, 이메일 요약, 리서치 자동화가 가능합니다. 한 번 명령을 학습한 패턴은 스킬로 저장되어 다음번엔 더 빠르게 실행됩니다.

코딩 자동화

반복적인 개발 패턴(예: REST API 엔드포인트 생성, 테스트 코드 작성)을 한 번 시키면 GEPA가 패턴을 학습합니다. 다음 비슷한 요청에서는 별도 가이드 없이 더 정확한 코드를 생성합니다.

리서치 자동화

웹 검색 → 추출 → 요약 → 다국어 번역 → 보고서 생성 파이프라인이 자동으로 구성됩니다. v0.11의 라이브 스트리밍으로 진행 과정을 실시간 확인 가능합니다.

엔터프라이즈 배포

AWS Bedrock 통합으로 기업 내부 인프라에서 프라이빗하게 배포 가능합니다. 데이터 주권 요구 사항이 있는 한국 공공기관/금융권에 적합합니다.

9. 시작하기 — 30분 안에 첫 메시지

설치는 npm, Docker, Bun 세 가지 방식이 지원되며, 가장 빠른 경로는 다음과 같습니다.

npm install -g @nousresearch/hermes-agent
hermes init my-agent
cd my-agent
hermes connect telegram --token YOUR_BOT_TOKEN
hermes start

세부 단계별 가이드는 별도 문서로 정리했으니 참고하시기 바랍니다.

10. 결론: 오픈소스 에이전트의 변곡점

2026년 4월 현재 시점에서, Hermes Agent v0.11.0은 다음 세 가지 측면에서 의미 있는 변곡점을 만들었습니다:

  1. 성능: GEPA로 클로즈드 모델 대비 동등 또는 우위 성능을 오픈 모델에서 달성
  2. 비용: 동일 작업 기준 20-90배 저비용으로 엔터프라이즈 채택 가능 영역 확장
  3. 접근성: 17개 메시지 플랫폼 통합으로 비개발자도 사용 가능

GitHub 별 105K가 7주 만에 모인 이유는 단순한 "또 다른 LLM 래퍼"가 아니라 자기 개선이라는 근본 메커니즘이 실제로 동작하기 때문입니다. 다음 6개월 동안 이 프로젝트가 어디까지 갈지 추적할 가치가 충분합니다.

FAQ

Q1. Hermes Agent를 사용하려면 GPU가 필요한가요?

로컬 Hermes 4.3 36B 실행 시에는 24GB+ VRAM (예: RTX 4090, A100)이 권장됩니다. 다만 GPT-5.5/Claude/Gemini API를 사용한다면 일반 노트북에서도 충분히 동작합니다.

Q2. MIT 라이선스이면 상업적 사용이 가능한가요?

네, 가능합니다. 코드 수정 후 폐쇄적으로 사용해도 무방하며, 재배포 시에는 MIT 라이선스 고지만 유지하면 됩니다.

Q3. 한국어 지원은 어느 수준인가요?

Hermes 4.3 36B는 다국어 학습 데이터로 학습되었으며, 한국어 응답 품질은 GPT-4o의 90% 수준입니다. 메시지 플랫폼 측면에서는 LINE, KakaoTalk 통합도 가능합니다(별도 어댑터).

Q4. 기존 OpenClaw 프로젝트에서 마이그레이션하려면 얼마나 걸리나요?

OpenClaw의 도구 정의 형식이 Hermes Agent와 호환되어, 단순 변환 스크립트로 4-8시간 내 마이그레이션 가능합니다.

Q5. 보안은 어떻게 보장되나요?

로컬 배포 시 데이터가 외부로 나가지 않습니다. 메시지 플랫폼 토큰은 OS 키체인에 저장되며, 모든 도구 호출은 감사 로그로 SQLite에 기록됩니다.


원문 출처: Hermes Agent 공식 사이트, GitHub Repository, v0.11.0 Release Notes

© 퀀텀점프클럽 정상록

이번 v0.11 분석은 여기까지 정리합니다. 이후 6개월 동안 Hermes Agent의 GEPA 학습 곡선과 엔터프라이즈 채택 사례를 추가로 추적해 후속 글로 공유하겠습니다.