본문으로 건너뛰기
블로그로 돌아가기
[REVIEW]

codebase-memory-mcp 총정리: AI 코딩 에이전트 토큰 낭비를 끝내는 코드베이스 인덱싱

9분 읽기1 views

codebase-memory-mcp 총정리: AI 코딩 에이전트 토큰 낭비를 끝내는 코드베이스 인덱싱

결론부터 말씀드릴게요. codebase-memory-mcp는 AI 코딩 에이전트가 코드베이스를 매번 파일 하나씩 열어보며 토큰을 태우는 문제를, 코드 전체를 미리 "지식 그래프"(함수·클래스·호출 관계의 지도)로 인덱싱해 한 번의 쿼리로 해결하는 MCP 서버입니다. 2026-02-24에 생겨난 신생 프로젝트인데 2026-06-29 기준 별 19,753개를 모았어요. 4개월여 만의 성장 속도가 MCP 생태계에서 보기 드뭅니다.

이 글에서는 이 도구가 정확히 뭘 하는지, 화제가 된 성능 수치를 어디까지 믿어야 하는지, 그리고 Serena·RAG 같은 경쟁 도구와 뭐가 다른지를 출처 기반으로 정직하게 정리해 드릴게요.

AI 코딩 에이전트는 왜 토큰을 낭비할까요?

Claude Code 같은 AI 코딩 에이전트(코드를 대신 읽고 짜주는 AI 도구)를 써보셨다면, 에이전트가 답을 하기 전에 파일을 수십 개씩 열어보는 장면을 보셨을 거예요. "이 함수를 누가 호출하지?" 같은 질문 하나에도 에이전트는 레포(저장소) 전체를 grep(텍스트 검색)하고 파일을 read하며 구조를 파악합니다.

문제는 이 과정이 토큰(AI가 글을 처리하는 단위, 곧 비용이자 컨텍스트 용량)을 엄청나게 먹는다는 점이에요. 긴 작업 세션일수록 에이전트는 같은 코드베이스 구조를 반복해서 재발견하느라 발품을 팝니다. 2026년 들어 AI 코딩 에이전트의 컨텍스트 효율이 핵심 화두가 된 이유가 여기 있어요. "에이전트가 레포 전체를 grep하지 않게 하라"는 메시지가 공감을 얻고 있죠.

codebase-memory-mcp는 바로 이 발품을 없애려는 도구입니다. 골목마다 걸어 들어가 확인하는 대신, 도시 전체 지도를 미리 그려두고 한 번에 길을 찾게 해주는 거예요.

codebase-memory-mcp는 무엇인가요?

codebase-memory-mcp란? 소스 코드를 tree-sitter(코드를 문법 트리로 분석하는 엔진)로 파싱해 함수·클래스·호출 체인·서비스 연결을 영속적인 지식 그래프로 만들고, 이 그래프를 MCP를 통해 AI 코딩 에이전트에게 제공하는 코드 인텔리전스 백엔드입니다.

조금 더 풀어볼게요. 이 도구는 코드를 tree-sitter로 분석해서 "함수 A가 함수 B를 호출한다", "이 HTTP 라우트는 저 서비스로 연결된다" 같은 관계를 지도(지식 그래프)로 그립니다. 이 지도는 단일 SQLite 파일(가벼운 데이터베이스 파일 하나)에 저장되고, 구조 쿼리는 프로젝트 자체 발표 기준 1밀리초 미만에 응답한다고 해요.

여기서 중요한 점 하나. 이 도구 자체에는 AI(LLM)가 없습니다. 그래프를 만들고 쿼리하는 백엔드일 뿐이고, 실제 지능 레이어는 MCP 클라이언트(Claude Code 등)가 담당해요. 코드베이스 인덱싱을 전담하는 "초고속 도서관 사서"라고 보시면 됩니다. 사서는 책을 읽어주진 않지만, 어느 책 몇 페이지에 뭐가 있는지를 즉시 찾아주죠.

핵심 스펙과 화제성

이 프로젝트가 왜 빠르게 주목받았는지는 숫자가 잘 보여줍니다. 아래는 GitHub 1차 출처에서 확인한 사실이에요.

  • 별 19,753개 / 포크 1,431개 / 기여자 30명 (2026-06-29 기준)
  • 2026-02-24 생성 — 약 4개월여 만에 2만 스타에 근접
  • 최신 릴리스 v0.8.1 (2026-06-12 게시), MIT 라이선스(상업적 사용·수정 자유)
  • C 단일 정적 바이너리 — 의존성 0, npm·Homebrew·go install 등 다양한 채널로 배포
  • 158개 언어 지원(현재 저장소 기준), 시맨틱 타입 해석은 Python·TS/JS·Go·Rust 등 12개 언어
  • 14개 MCP 도구11개 코딩 에이전트 자동 설정(Claude Code, Codex CLI, Gemini CLI, Zed, Aider 등)
  • 100% 로컬 — 코드와 임베딩이 로컬에만 머무르고 API 키가 필요 없음

추가로 Louvain 커뮤니티 탐지(기능 모듈 자동 발견), git-diff 영향도 매핑(변경의 위험 범위 분류), 죽은 코드 탐지 같은 분석 기능도 들어 있어요. 단일 바이너리 하나로 이만큼을 로컬에서 처리한다는 점이 매력 포인트입니다.

"120배 토큰 절감"은 진짜일까요?

이 부분을 가장 정직하게 짚고 넘어가야 합니다. codebase-memory-mcp의 토큰 절감 수치는 출처가 다른 두 개의 숫자가 돌아다녀요. 혼동하기 쉬우니 분리해서 보겠습니다.

첫째, README 헤더의 "120배(99% 절감)". 이건 5개 구조 쿼리만 한정한 비교(약 3,400 토큰 vs 파일별 탐색 약 412,000 토큰)로, 프로젝트가 자체 발표한 마케팅 수치입니다. 가장 그래프 친화적인 베스트케이스만 뽑은 값이에요.

둘째, arXiv 논문(arXiv:2603.27277, 2026-03-28 게시)의 "10배 토큰 절감". 이건 31개 실제 레포에 걸친 종합 벤치마크 수치로, 동료 평가에 가까운 학술 측정값입니다. 같은 논문은 답변 품질을 83%(파일 탐색 에이전트 92% 대비), 도구 호출은 2.1배 절감으로 보고했어요. 두 토큰 수치는 모순이 아니라 다른 실험의 다른 숫자입니다.

정직한 요약: 토큰과 도구 호출을 크게 줄이는 대신, 답변 품질은 약 9%p 낮아집니다(83% vs 92%). "더 싸고 빠르지만 약간 덜 정확"이 이 도구의 정확한 트레이드오프예요. "밀리초 인덱싱", "1ms 미만 쿼리" 같은 표현도 모두 자체 발표 수치이지 독립 벤치마크가 아니라는 점을 기억하세요.

Serena·RAG와 무엇이 다른가요?

코드베이스 인덱싱 도구는 이미 여럿 있습니다. codebase-memory-mcp의 차별점은 tree-sitter AST + 명시적 지식 그래프 + MCP의 결합이에요. 비슷한 도구들과 비교하면 성격이 또렷해집니다.

Serena(oraios/serena)는 LSP(언어 서버) 기반으로 심볼 레벨 검색과 편집·리팩토링에 강합니다. "코드를 고치는 IDE 두뇌"에 가깝죠. 반면 codebase-memory-mcp는 구조를 읽고 지도화하는 "초고속 인덱서"입니다. 쓰기보다 읽기·관계 쿼리·속도에 특화돼 있어요.

RAG 방식 코드 검색(예: zilliztech/claude-context)은 임베딩 벡터 유사도로 "비슷한 코드"를 찾습니다. 텍스트 의미가 비슷한 걸 찾는 거죠. 그런데 codebase-memory-mcp는 "함수 A를 호출하는 곳 전부", "이 변경의 영향 범위" 같은 구조적 관계를 명시적 그래프로 답합니다. ctags(심볼 점프)나 Sourcegraph(호스팅형 검색 플랫폼)와도 결이 달라요. 관계형 구조 쿼리를 1ms 미만에 답하는 게 핵심 차별점입니다.

누구에게, 언제 유용할까요?

정리하면, AI 코딩 에이전트로 중·대형 코드베이스를 자주 다루는 분에게 잘 맞습니다. 에이전트가 구조 파악에 토큰을 너무 쓴다고 느끼거나, 긴 세션에서 컨텍스트가 빠르게 차오르는 게 고민이라면 도입을 고려할 만해요. 100% 로컬이라 코드를 외부로 보내고 싶지 않은 보안 민감 환경에도 적합하고, C 단일 바이너리라 설치 부담도 적습니다.

다만 도입 전 알아둘 한계가 몇 가지 있어요. 첫째, 마케팅 수치(120배·밀리초)는 자체 발표이니 그대로 믿기보다 자기 레포에서 직접 측정해 보시는 게 좋습니다. 둘째, 답변 품질이 파일 탐색 방식보다 약간 낮은 트레이드오프가 있어요(83% vs 92%). 정밀함이 절대적으로 중요한 작업엔 보완이 필요합니다.

셋째, 자동 설정 기능은 편리하지만 에이전트 설정 파일에 write합니다(11개 에이전트 config를 자동 수정). 설정 파일이 바뀌는 게 부담스럽다면 자동 설정을 끄고 수동으로 연결하세요. 코드 자체는 로컬에만 머무르지만, 설정 변경은 별개의 이야기입니다. 이 정도만 인지하고 들어가면, 토큰 효율이 중요한 AI 코딩 워크플로우에서 충분히 검토해 볼 가치가 있는 코드베이스 인덱싱 도구예요.

자주 묻는 질문 (FAQ)

Q: codebase-memory-mcp는 무료인가요?

네, MIT 라이선스로 상업적 사용·수정·재배포가 자유롭고 책임은 면책됩니다. 또한 100% 로컬에서 동작해 별도 API 키나 클라우드 비용이 들지 않아요. 의존성 0의 C 단일 바이너리라 설치도 가볍습니다.

Q: Claude Code에서 바로 쓸 수 있나요?

네, 자동 설정이 지원하는 11개 코딩 에이전트에 Claude Code가 포함돼 있어요. Codex CLI, Gemini CLI, Zed, Aider 등도 자동 설정 대상입니다. 다만 자동 설정은 에이전트 설정 파일에 직접 write하므로, 설정 변경을 원치 않으면 수동 연결을 선택하시면 됩니다.

Q: 토큰 절감 효과가 정말 120배인가요?

"120배"는 5개 구조 쿼리만 한정한 프로젝트 자체 발표 수치예요. 31개 실제 레포를 평가한 arXiv 논문 기준으로는 약 10배 토큰 절감이 더 일반적인 값입니다. 대신 답변 품질이 파일 탐색 방식의 92% 대비 83%로 약간 낮은 트레이드오프가 있다는 점을 함께 보셔야 합니다.

Q: RAG 코드 검색이랑 같은 건가요?

다릅니다. RAG는 임베딩 벡터 유사도로 "의미가 비슷한 코드"를 찾는 방식이고, codebase-memory-mcp는 "누가 누구를 호출하는가" 같은 구조적 관계를 명시적 지식 그래프로 답합니다. 비슷함을 찾는 게 아니라 관계를 추적하는 게 핵심 차이예요.

마무리

정리하면, codebase-memory-mcp는 "AI 코딩 에이전트가 코드베이스를 매번 grep하지 않게" 만드는 코드베이스 인덱싱 도구입니다. tree-sitter로 만든 지식 그래프 덕분에 토큰과 도구 호출을 크게 줄여 주죠. 다만 프로젝트가 README에 내건 "120배"는 베스트케이스 수치이고, arXiv 논문 기준으로는 "10배 절감에 답변 품질 83%"라는 트레이드오프가 있다는 점은 꼭 기억하세요. 긴 AI 코딩 세션에서 토큰이 자꾸 아깝다면, MIT 라이선스에 100% 로컬로 도는 이 MCP 서버를 한 번 시험해 볼 만합니다.

참고 자료


© 퀀텀점프클럽 정상록