본문으로 건너뛰기
블로그로 돌아가기
[TREND]

OpenMontage 소개·분석: 코딩 에이전트로 진짜 영상 만드는 오픈소스

9분 읽기1 views

OpenMontage 소개·분석: 코딩 에이전트로 "진짜 영상"까지 만드는 오픈소스 시스템

결론부터 말씀드릴게요. OpenMontage는 이미 쓰고 있는 AI 코딩 에이전트(Claude Code·Cursor·Copilot·Windsurf·Codex)를 그대로 영상 제작 스튜디오로 바꾸는 오픈소스 시스템이에요. 새 SaaS를 구독하는 게 아니라, 저장소 하나를 클론해서 가진 에이전트의 능력을 확장하는 거죠. 게다가 슬라이드쇼 수준이 아니라 실제 모션 영상까지 만들고, 제작자 공개 기준으로 한 편에 1달러 안팎이라는 점이 눈에 띕니다.

이 글에서는 OpenMontage의 정체성과 작동 방식, "진짜 영상"이라는 차별점, 무료·저비용 경로, 품질 게이트, 그리고 1인 기업에게 어떤 의미인지까지 정직하게 짚어볼게요.

OpenMontage란 무엇인가요?

OpenMontage는 스스로를 "최초의 오픈소스 에이전트형 영상 제작 시스템(The first open-source, agentic video production system)"이라고 소개해요. 별도의 코드 오케스트레이터가 없는 게 핵심이에요. README의 표현 그대로 "코드 오케스트레이터는 없다. 당신의 AI 코딩 어시스턴트가 곧 오케스트레이터다"라는 구조죠.

평문 프롬프트 한 줄을 주면 에이전트가 리서치 → 기획 → 스크립트 → 에셋 생성 → 편집 → 최종 합성까지 알아서 진행해요. 라이선스는 GNU AGPL-3.0이고, 요구 환경은 Python 3.10+, FFmpeg, Node.js 18+, 그리고 AI 코딩 어시스턴트 1종이에요. 설치는 git clonemake setup 정도로 단순합니다.

저장소 인기도 꽤 높아요. 2026-06-22 조회 기준으로 ⭐ 8,904개, 포크 1,317개를 기록하고 있어요.

어떻게 작동하나요? (에이전트 우선 아키텍처)

OpenMontage는 3계층 지식 구조로 짜여 있어요. tools/pipeline_defs/가 "무엇이 있는가"를, skills/가 "OpenMontage가 원하는 사용법과 품질 기준"을, .agents/skills/가 "외부 기술 지식 팩"을 담당하죠.

표준 파이프라인 흐름은 research → proposal → script → scene_plan → assets → edit → compose예요. 각 스테이지마다 전담 디렉터 스킬(마크다운 지시서)이 붙고, 도구를 호출할 때는 7개 차원(task fit 30%, output quality 20%, control 15%, reliability 15%, cost efficiency 10%, latency 5%, continuity 5%)으로 프로바이더를 점수화해서 고릅니다.

특히 웹 리서치가 1급 스테이지라는 점이 인상적이에요. 스크립트 한 글자를 쓰기 전에 YouTube·Reddit·Hacker News·뉴스·학술 소스에서 15~25회 이상 검색해 데이터와 청중 질문, 트렌드 앵글을 모으고 구조화된 브리프에 인용해요. 환각이 아니라 실제·최신 정보에 근거하도록 설계한 거죠.

규모로 보면 상위 표기 기준 12개 파이프라인 / 52개 도구 / 500+ 에이전트 스킬을 갖췄어요. (다만 저장소 본문 일부엔 11개 파이프라인 / 48개 도구 / 400+ 스킬 같은 구표기가 잔존하는데, 프로젝트가 진화하면서 헤더와 본문 수치가 다른 거예요.)

"진짜 영상"을 만든다는 게 무슨 뜻인가요?

이게 OpenMontage의 가장 큰 차별점이에요. 대다수 무료 AI 영상 스택은 스틸 이미지 몇 장을 켄 번스(Ken Burns)식으로 움직이는 수준이에요. OpenMontage도 그건 하지만, 거기서 멈추지 않아요.

무료 스톡 영상과 공개 아카이브(Archive.org, NASA, Wikimedia Commons, Pexels, Pixabay)로 CLIP 검색이 가능한 코퍼스를 만들고 → 실제 모션 클립을 의미 검색으로 찾아 → 타임라인에 편집해서 → 완성본을 렌더해요. 이게 바로 Documentary Montage 파이프라인이에요. 유료 영상 생성 API 없이도 실사 모션 영상을 만들 수 있다고 명시하고 있죠.

렌더 엔진도 용도별로 나뉘어요. Remotion(React 기반, 데이터·이미지 씬), HyperFrames(HTML·CSS·GSAP, 모션그래픽·키네틱 타이포), FFmpeg(합성·인코딩·자막 번인) 세 가지를 골라 씁니다. 렌더 런타임은 제안 단계에서 잠기고, 도중에 무단으로 바꾸면 거버넌스 위반으로 취급해요.

무료·저비용으로 어디까지 되나요?

OpenMontage는 "API 키 0개"로도 시작할 수 있어요. make setup만 하면 Piper TTS(완전 무료 오프라인 나레이션) + 공개 아카이브 영상 + 무료 스톡 + Remotion·HyperFrames 렌더 + FFmpeg 후반 + 단어 단위 자막이 갖춰져요. 두 가지 무료 경로가 있는데, 하나는 이미지 기반 영상(Piper 나레이션 + 이미지 + Remotion 애니메이션), 다른 하나는 실사 다큐 몽타주예요.

키를 붙여도 단가가 낮아요. **제작자 공개 기준(외부 미검증)**으로 README의 데모 단가는 이래요. 60초 픽사풍 단편 "THE LAST BANANA"가 약 $1.33, OpenAI 키 1개만 쓴 제품 광고 "VOID — Neural Interface"가 약 $0.69, FLUX 이미지 기반 지브리풍 단편 3편("Afternoon in Candyland"·"Mori no Seishin"·"Into the Abyss")이 각각 약 $0.15였어요.

"영상 1편에 외주 수십만 원"이라는 멘탈 모델을 흔드는 숫자죠. 다만 이 비용은 제작자 자기 보고치이고 외부에서 독립 재현·검증된 값은 아니라는 점은 알고 계셔야 해요.

품질 게이트와 예산 거버넌스가 핵심이에요

자동화에서 가장 무서운 건 "맡겼더니 결과물이 엉망"인 상황이잖아요. OpenMontage는 여기에 신경을 많이 썼어요.

발행 전에 다중 자가검토를 강제해요. ffprobe 검증, 프레임 4지점 추출로 블랙프레임·깨진 오버레이 검사, 오디오 레벨 분석, "딜리버리 약속" 준수 검증, 자막 존재 확인까지 거치죠. 그리고 슬라이드쇼처럼 보이는 렌더는 6차원 슬라이드쇼 리스크 스코어링으로 따로 걸러냅니다. 모든 프로바이더 선택은 감사 가능한 결정 로그에 남아요.

예산도 통제돼요. 실행 전 견적(Estimate) → 예산 예약(Reserve) → 사후 정산(Reconcile) 흐름이고, observe/warn/cap 모드를 고를 수 있어요. 액션별 승인 임계 기본값은 $0.50, 총예산 캡 기본값은 $10(설정 가능)이라 "깜짝 청구서 없음"을 내세웁니다.

1인 기업·바이브코딩 관심층에게 어떤 의미일까요?

이미 Claude Code나 Codex를 쓰는 1인 기업이라면, 같은 에이전트에 저장소 하나만 추가로 붙이면 영상 스튜디오가 생기는 셈이에요. 새 구독이 아니라 가진 도구의 능력 확장이라는 게 가장 큰 매력이죠. 제작비도 무료 경로가 있고, 키를 붙여도 데모 단가가 $0.15~$1.33 수준이고요.

다만 두 가지는 솔직하게 봐야 해요.

첫째, 라이선스가 AGPL-3.0 카피레프트예요. "무료, 내 PC에서, 벤더 락인 없음"은 분명한 장점이지만, AGPL은 서버형으로 배포하면 소스 공개 의무가 따라요. 개인이나 내부 제작에는 아무 문제가 없지만, 이걸 그대로 상업 SaaS로 래핑하려면 제약이 있다는 뜻이에요.

둘째, 활동성이에요. 2026년 3월 29일 공개(약 3개월 전)됐고, 마지막 커밋은 2026년 5월 7일(약 6주 전)이에요. "지금도 폭발적으로 개발 중"이라기보다 "3월 말 공개 후 빠르게 8,900개 넘는 스타를 모은 프로젝트"로 보는 게 정확해요.

트렌드 맥락도 OpenMontage에 우호적이에요. a16z는 2026년 봄에 "2025년이 영상의 해였다면 2026년은 에이전트가 영상을 편집하는 해"라며, Cursor가 코딩에 한 일을 영상 에이전트가 제작에 할 거라고 봤어요. Remotion 공식 문서도 코딩 에이전트로 영상을 프롬프트하는 패턴을 별도로 다룰 만큼, 이 조합은 자리를 잡아가고 있습니다.

마무리

OpenMontage는 "에이전트가 알아서 다 한다"는 마법이 아니라, 중간 산출물을 투명하게 보여주고 사람이 승인·수정하는 human-in-the-loop 설계를 택했어요. 코딩 에이전트를 이미 업무에 쓰고 계신다면, 영상 제작까지 같은 워크플로우로 끌어오는 실험을 한 번쯤 해볼 가치가 있어요. 무료 경로부터 작게 시작해서, 품질 게이트와 예산 캡이 정말 "쓰레기 안 내놓는 장치"로 작동하는지 직접 확인해보시길 권합니다.


자주 묻는 질문 (FAQ)

Q: OpenMontage를 쓰려면 비싼 AI 영상 구독이 필요한가요?

아니에요. API 키 0개로도 make setup만 하면 Piper TTS, 무료 스톡·공개 아카이브 영상, Remotion·FFmpeg 렌더, 단어 단위 자막까지 갖춰져요. 유료 키를 붙여도 README 데모 단가가 약 $0.15~$1.33(제작자 공개 기준, 외부 미검증) 수준이에요.

Q: 다른 무료 AI 영상툴이랑 뭐가 다른가요?

대부분의 무료 툴은 스틸 이미지를 켄 번스식으로 움직이는 슬라이드쇼 수준이에요. OpenMontage는 그것도 하지만, 무료 스톡·아카이브로 CLIP 검색 코퍼스를 만들어 실제 모션 클립을 의미 검색·편집하는 Documentary Montage 파이프라인을 제공해요. "진짜 영상"을 만든다는 게 차별점이죠.

Q: 상업 서비스로 만들어 팔아도 되나요?

주의가 필요해요. OpenMontage는 GNU AGPL-3.0 카피레프트 라이선스라, 서버형으로 배포하면 소스 공개 의무가 따라요. 개인·내부 제작에는 무해하지만, 그대로 상업 SaaS로 래핑하려면 제약이 있어요.

Q: 코딩을 잘 못해도 쓸 수 있나요?

OpenMontage는 Claude Code·Cursor·Copilot·Windsurf·Codex 같은 코딩 에이전트가 오케스트레이터 역할을 해요. 평문 프롬프트 한 줄을 주면 에이전트가 리서치부터 합성까지 진행하고, 모든 창작 결정에 사용자 승인을 받는 구조라 코드를 직접 짜기보다 방향을 잡고 검토하는 쪽에 가까워요.

Q: 지금도 활발하게 개발되고 있나요?

2026년 3월 29일 공개(약 3개월 전)된 프로젝트로, 마지막 커밋은 2026년 5월 7일(약 6주 전)이에요. 공개 후 빠르게 8,900개 넘는 스타(2026-06-22 조회 기준 ⭐ 8,904)를 모았지만, 커밋 활동은 봄철에 집중됐다고 보는 게 정확해요.


참고자료