Supermemory: AI 에이전트를 위한 메모리 API 플랫폼 완벽 가이드
Supermemory: AI 에이전트를 위한 메모리 API 플랫폼 완벽 가이드
Supermemory는 인간 뇌에서 영감받은 지식 그래프 기반 메모리 엔진으로, AI 에이전트에 장기 기억 능력을 부여하는 API 플랫폼입니다.
AI 에이전트의 가장 큰 약점 중 하나는 "기억력"입니다. 대화가 끝나면 모든 맥락이 사라지고, 다음 세션에서 같은 질문을 반복해야 합니다. Supermemory는 이 문제를 근본적으로 해결하는 메모리 API 플랫폼으로, 20세 창업자 Dhravya Shah가 설립하고 Google AI 수장 Jeff Dean의 투자를 받아 주목받고 있습니다.
이 글에서는 Supermemory의 핵심 기술, 실제 통합 방법, 경쟁사 비교, 그리고 주의할 점까지 상세히 분석합니다.
Supermemory란 무엇인가
Supermemory는 AI 앱과 에이전트를 위한 메모리 API 플랫폼입니다. 단순한 벡터 데이터베이스가 아니라, 인간 뇌의 기억 시스템에서 영감받은 지식 그래프 기반 메모리 엔진을 제공합니다.
기존 벡터 검색이 "유사한 문장 찾기"에 그친다면, Supermemory는 정보를 추출하고, 연결하고, 업데이트하며, 모순을 처리하고, 오래된 정보를 자연스럽게 삭제합니다. 이는 인간이 기억을 관리하는 방식과 유사합니다.
핵심 기능
- 메모리 CRUD: 메모리 생성, 조회, 수정, 삭제
- 시맨틱 검색: 약 50ms 응답 시간의 의미 기반 검색
- 자동 사용자 프로파일: 대화에서 사용자 선호도 자동 추출
- 지식 그래프: 정보 간 암묵적 연결 자동 생성
- 지능형 감쇠: 사용 빈도에 따른 자연스러운 정보 감쇠
- 모순 처리: 상충하는 정보의 자동 업데이트/병합
개발자 API와 소비자 앱 이중 전략
Supermemory는 두 가지 제품을 동시에 운영합니다. 개발자를 위한 메모리 API와 일반 사용자를 위한 AI 비서 앱 Nova입니다. API 플랫폼으로 개발자 생태계를 구축하면서, Nova를 통해 소비자 시장까지 공략하는 전략입니다.
창업자와 투자 배경
Dhravya Shah: 20세 창업자의 이력
Dhravya Shah는 인도 뭄바이 출신으로, Arizona State University를 중퇴하고 Supermemory를 창업했습니다. "40주 동안 매주 1개씩 프로젝트를 만들겠다"는 챌린지 중에 Supermemory의 원형이 탄생했습니다.
이전에는 트윗 스크린샷 봇을 개발하여 소셜 미디어 도구 기업 Hypefury에 매각한 경험이 있으며, 이를 통해 개발자 도구 시장에 대한 감각을 키웠습니다.
$2.6M 시드 투자 (2025년 10월)
시드 라운드에서 $2.6M을 유치했으며, 투자자 라인업이 주목할 만합니다.
- Jeff Dean (Google AI 수장): AI 인프라의 핵심 인물
- Matthew Prince (Cloudflare CEO): 인프라 스케일링 전문가
- Logan Kilpatrick (전 OpenAI, 현 Google): AI 개발자 생태계 전문가
- David Cramer (Sentry 창업자): 개발자 도구 시장의 베테랑
- 리드 VC: Susa Ventures, Browder Capital, SF1.vc
이 투자자 구성은 Supermemory가 "AI 인프라"로서의 잠재력을 인정받았음을 보여줍니다.
기술 아키텍처 심층 분석
지식 그래프 기반 메모리 엔진
Supermemory의 핵심은 커스텀 벡터 그래프 엔진입니다. 일반적인 RAG(Retrieval-Augmented Generation) 시스템이 문서를 청크로 나눠 벡터 DB에 저장하는 것과 달리, Supermemory는 정보를 노드와 엣지로 구성된 지식 그래프로 관리합니다.
인간 뇌 영감 메커니즘
| 메커니즘 | 설명 | 기술적 구현 |
|---|---|---|
| 지능형 감쇠 | 사용하지 않는 정보는 자연스럽게 중요도 하락 | 접근 빈도 기반 가중치 조정 |
| 암묵적 연결 | 관련 정보끼리 자동으로 연결 | 그래프 엣지 자동 생성 |
| 지식 업데이트 | 새 정보가 기존 정보를 수정 | 노드 병합/교체 로직 |
| 모순 처리 | 상충하는 정보 감지 및 최신 정보 우선 | 타임스탬프 기반 충돌 해결 |
벤치마크 성능
Supermemory는 주요 메모리 벤치마크에서 SOTA(State of the Art)를 달성했습니다.
- LongMemEval: 85.86% (프로덕션 환경), 약 99% (실험적 ASMR 시스템)
- LoCoMo: 1위
- ConvoMem: 1위
단, 99% 수치는 실험적 ASMR(Adaptive Supermemory Retrieval) 시스템의 결과이며, 실제 프로덕션에 배포된 시스템은 85.86%입니다. 이 구분을 인지하는 것이 중요합니다.
기술 스택
| 구성 요소 | 기술 |
|---|---|
| 백엔드 프레임워크 | Hono |
| 데이터베이스 | PostgreSQL + Drizzle ORM |
| 검색 엔진 | 커스텀 벡터 그래프 엔진 |
| 프론트엔드 | Next.js |
| 브라우저 확장 | WXT |
| 모노레포 | Turborepo |
| 인프라 | Cloudflare Workers/D1/R2 |
20,000명 이상의 사용자를 월 $5 수준의 인프라 비용으로 운영한다는 점이 인상적입니다.
개발자 통합 가이드
AI SDK 미들웨어 (2줄 통합)
가장 간단한 통합 방법은 withSupermemory() 미들웨어입니다.
import { withSupermemory } from "@supermemory/ai-sdk";
const result = await generateText(
withSupermemory(model, {
apiKey: process.env.SUPERMEMORY_API_KEY,
userId: "user-123",
}),
{ prompt: "이전 대화에서 논의한 프로젝트 진행 상황은?" }
);
이 2줄만으로 AI 모델에 장기 기억 능력이 추가됩니다.
MCP 서버 통합
Claude Code, Cursor, OpenCode 등 MCP를 지원하는 도구에서 바로 사용할 수 있습니다.
{
"mcpServers": {
"supermemory": {
"command": "npx",
"args": ["-y", "@supermemory/mcp-server"],
"env": {
"SUPERMEMORY_API_KEY": "your-api-key"
}
}
}
}
Function Calling 통합
기존 Function Calling 패턴에 메모리 도구를 추가하는 방식도 지원합니다.
지원 커넥터
| 카테고리 | 커넥터 |
|---|---|
| 클라우드 스토리지 | Google Drive, OneDrive |
| 이메일 | Gmail |
| 생산성 | Notion |
| 개발 | GitHub |
| 웹 | 웹 크롤러 |
| 파일 처리 | PDF, 이미지(OCR), 영상(트랜스크립션), 코드(AST-aware 청킹) |
경쟁사 비교: Mem0 vs Zep vs Letta vs Supermemory
AI 메모리 분야의 주요 경쟁사를 비교합니다.
| 비교 항목 | Supermemory | Mem0 | Zep | Letta |
|---|---|---|---|---|
| 아키텍처 | 지식 그래프 | 벡터 DB 기반 | 그래프 + 벡터 | 에이전트 프레임워크 |
| 벤치마크 (LongMemEval) | 85.86% (SOTA) | 공개 데이터 제한 | 공개 데이터 제한 | 공개 데이터 제한 |
| 통합 난이도 | 2줄 미들웨어 | SDK 제공 | SDK 제공 | 프레임워크 종속 |
| MCP 지원 | 있음 | 있음 | 제한적 | 없음 |
| 소비자 앱 | Nova | 없음 | 없음 | 없음 |
| 오픈소스 | 코드 공개 (셀프호스팅 제한) | 부분 오픈소스 | 오픈소스 | 오픈소스 |
| 무료 티어 | 1M 토큰/월 | 제한적 | 있음 | 있음 |
Scira AI의 Mem0 to Supermemory 전환 사례
AI 검색 엔진 Scira AI가 Mem0에서 Supermemory로 전환한 사례가 대표적입니다.
- 사용량 32% 증가: 사용자 참여도가 크게 향상
- 레이턴시 대폭 감소: 검색 응답 속도 개선
- 커넥터 즉시 작동: 별도 설정 없이 바로 연동
Scira AI 측은 "Mem0보다 1,000배 낫다"고 평가했으며, 이 사례는 LogRocket 블로그에서도 별도로 보도되어 교차 검증됩니다.
가격 정책
| 플랜 | 월 비용 | 토큰 | 쿼리 | 적합 대상 |
|---|---|---|---|---|
| Free | $0 | 1M | 10K | PoC, 개인 프로젝트 |
| Pro | $19 | 3M | 100K | 소규모 프로덕션 |
| Scale | $399 | 80M | 20M | 대규모 서비스 |
| Enterprise | 커스텀 | 커스텀 | 커스텀 | 엔터프라이즈 |
무료 티어의 월 1M 토큰과 10K 쿼리는 개인 프로젝트나 PoC(Proof of Concept)에 충분한 수준입니다. Pro 플랜의 $19/월 역시 경쟁사 대비 합리적인 가격대입니다.
주의할 점
오픈소스 표기에 대한 주의
Supermemory의 코드는 GitHub에 공개되어 있지만, 진정한 오픈소스는 아닙니다. 셀프호스팅을 하려면 엔터프라이즈 계약이 필요합니다. 코드를 참고하거나 기여하는 것은 가능하지만, 프로덕션에서 자체 인프라로 운영하려면 별도 협의가 필요합니다.
벤치마크 수치 해석
99%에 가까운 벤치마크 수치는 실험적 ASMR 시스템의 결과입니다. 실제 프로덕션 환경에서의 성능은 85.86%입니다. 여전히 SOTA이지만, 마케팅 자료의 수치를 액면 그대로 받아들이기보다 프로덕션 수치를 기준으로 판단하는 것이 좋습니다.
벤더 종속 리스크
관리형 API 서비스 특성상, Supermemory에 대한 의존도가 높아지면 전환 비용이 발생할 수 있습니다. 중요한 프로젝트라면 추상화 레이어를 두어 추후 다른 메모리 솔루션으로의 전환 가능성을 열어두는 것을 권장합니다.
자주 묻는 질문 (FAQ)
Supermemory와 벡터 DB의 차이점은 무엇인가요?
벡터 DB는 텍스트를 임베딩으로 변환하여 유사도 기반 검색을 수행합니다. Supermemory는 여기에 지식 그래프, 자동 연결, 모순 처리, 지능형 감쇠 등을 추가하여 "기억"에 가까운 기능을 제공합니다.
무료 티어로 어느 정도 규모의 프로젝트까지 가능한가요?
월 1M 토큰과 10K 쿼리면, 일일 약 333건의 쿼리를 처리할 수 있습니다. 개인 AI 비서, 소규모 챗봇, PoC 수준의 프로젝트에 충분합니다.
MCP 서버로 Claude Code에서 사용하는 방법은?
claude_desktop_config.json에 MCP 서버 설정을 추가하면 됩니다. npx -y @supermemory/mcp-server로 실행하며, API 키만 환경 변수로 전달하면 바로 사용 가능합니다.
기존 Mem0에서 마이그레이션이 가능한가요?
공식 마이그레이션 도구는 제공되지 않지만, Supermemory API를 통해 기존 데이터를 재인덱싱하는 것이 가능합니다. Scira AI 사례처럼 API 레이어만 교체하는 방식이 일반적입니다.
데이터는 어디에 저장되나요?
Supermemory의 관리형 서비스를 사용하면 Cloudflare 인프라에 저장됩니다. 데이터 레지던시가 중요한 경우 엔터프라이즈 플랜에서 리전 선택이 가능합니다.
마무리
Supermemory는 AI 에이전트의 "장기 기억" 문제를 지식 그래프 기반으로 해결하는 플랫폼입니다. 20세 창업자, Google AI 수장의 투자, LongMemEval SOTA 달성이라는 조합은 주목할 만합니다.
특히 withSupermemory() 미들웨어 2줄 통합과 MCP 서버 지원은 개발자 경험 측면에서 큰 장점입니다. 무료 티어도 넉넉하여 진입 장벽이 낮습니다.
AI 에이전트를 개발하고 있다면, 메모리 레이어로 Supermemory를 검토해볼 가치가 있습니다. 다만 셀프호스팅 제한과 벤더 종속 리스크는 고려해야 합니다.
참고 자료
- Supermemory 공식 사이트
- GitHub - supermemoryai/supermemory
- TechCrunch - "A 19-year-old nabs backing from Google execs for his AI memory startup Supermemory"
- Supermemory Memory Engine 기술 블로그
- Supermemory Research (벤치마크)
- AI SDK - Supermemory Provider
- LogRocket - Building AI apps with Mem0 & Supermemory
- Scira AI 전환 사례