Skip to content
Back to Blog
[TUTORIAL]

AI가 손그림 삽화를 자동 생성해 주는 오픈소스 Codex 스킬

4 min read1 views

AI가 내 글에 손그림 삽화를 자동으로 그려준다면?

블로그 글을 쓰다 보면 한 번씩 이런 생각을 해요. "이 개념을 그림 한 장으로 보여줄 수 있으면 좋을 텐데." 그렇다고 일러스트레이터를 고용하거나 Figma를 열고 직접 그리기엔 시간이 없죠.

2026-06-30 기준 GitHub에서 6,510 stars, 781 forks를 받은 오픈소스 프로젝트 ian-xiaohei-illustrations가 딱 그 지점을 건드려요. AI 에이전트가 글의 핵심 개념을 읽고 순백 배경 손그림 삽화를 자동으로 만들어 주는 Codex 스킬이에요. MIT 라이선스라 개인·상업 프로젝트 모두 자유롭게 쓸 수 있고, 2026-06-28 — 이 글을 쓰는 시점으로 이틀 전 — 한국어판 moongi-xiaohei-illustrations도 공개됐어요.

이 스킬이 정확히 뭔가요?

단순한 프롬프트 모음이 아니에요. SKILL.md와 references 구조를 갖춘 재사용 가능한 AI 에이전트 스킬이에요. 블로그 글이든 Notion 문서든 본문을 넘기면 AI가 적절한 삽화를 기획하고 생성해 주는 방식이에요. Claude Code, Codex, Claude 채팅 어디서든 동일하게 작동하고, 핵심 개념은 "재사용 가능한 시각 언어를 스킬로 패키징한다"는 거예요.

중국어·한국어 글과 게시물, 블로그, Notion 문서에 본문 삽화를 붙이는 걸 AI 에이전트가 처리하도록 설계됐어요. 2026-05-27에 원본이 처음 공개됐고, 한 달 남짓 만에 6,500개 넘는 별을 받은 건 꽤 빠른 편이에요.

핵심 철학: 그림이 아니라 '인지 앵커'

이 스킬이 다른 AI 이미지 도구와 구별되는 포인트가 있어요. 그냥 "그림 하나 붙여줘"가 아니라는 거예요.

스킬의 접근 방식은 이렇게 요약할 수 있어요. 글 속에서 독자가 가장 헷갈리거나 꼭 기억해야 할 '인지 앵커' — 핵심 판단 순간, 두 개의 단절점, 입력과 출력이 맞물리는 폐루프(닫힌 흐름), 전후 대비, 흔히 빠지는 함정 — 를 하나만 골라서, 그 동작 하나만을 기억에 남을 한 장으로 그려내요.

PPT 인포그래픽이나 복잡한 아키텍처 도면, 귀여운 포스터가 아니에요. 글을 혼자 읽을 때 독자가 가장 놓치기 쉬운 바로 그 순간을 시각화하는 게 목적이에요. 워크플로우도 8단계로 구성돼 있어요. 본문 소화 → 인지 앵커 추출 → 기본 4~8장 shot list 작성 → 구조 타입 선택 → 저기술 물리 은유 재발명 → 캐릭터가 핵심 동작 수행 → 장당 개별 생성 → QA → 저장.

소흑(小黑) — 단순하지만 진지한 시각 IP

이 스킬에는 고유한 마스코트 '소흑(小黑)'이 있어요. 검정 실루엣, 흰 점 두 개짜리 눈, 가는 다리, 무표정. 생김새는 심플하지만 역할은 달라요.

소흑은 옆에서 장식처럼 서 있는 캐릭터가 아니에요. 그림의 핵심 동작 주체여야 해요. 스킬에 실린 예시를 보면 — 소흑이 '소재 상자'를 든 채 컨베이어 벨트가 끊겨 있고, 콘텐츠 박스가 구멍으로 빠지는 장면이에요. 빨강·파랑·주황 손글씨 주석이 짧게 달려 있고, 소흑은 그 안에서 실제로 일하고 있어요. 스킬에서 이 캐릭터를 "시스템 운전에 진지하게 참여하는 부조리한 작업자"라고 설명하는데, 한 번 들으면 딱 와닿아요.

시각 스타일도 명확하게 정해져 있어요. 순백 배경(종이 질감·그림자·그라데이션 모두 금지), 검정 손그림 가는 선, 미세한 손떨림, 충분한 여백, 소량의 빨강·파랑·주황 손글씨 주석. 그림 하나에 개념 하나, 좌상단 유형 제목 없음. 그리고 매번 새로운 "기묘하지만 성립하는 저기술 물리 은유"를 새로 발명하는 게 규칙이에요. 공식처럼 찍어내지 않는다는 거죠.

한국어판의 의미 — 내 캐릭터가 내 브랜드 IP가 돼요

한국어판 moongi-xiaohei-illustrations(2026-06-28 공개)는 원본보다 한 발 더 나아가요.

첫째, 주석을 한국어와 영어로 모두 쓸 수 있어요. 원본은 중국어 위주라 그대로 쓰기 어려웠는데, 한국어판은 2~5단어 짧은 라벨로 주석을 자연스럽게 달 수 있어요. 라벨이 너무 길면 손그림 느낌이 깨지거든요.

둘째, 소흑 자리에 내 캐릭터를 넣을 수 있어요. 캐릭터 이미지를 하나 첨부하면 AI가 소흑 대신 그 캐릭터를 핵심 동작의 주체로 배치해요. image-to-image나 reference 방식(예: Higgsfield 같은 도구)으로 매 장 동일한 레퍼런스를 재사용하기 때문에 캐릭터 일관성도 꽤 잘 유지돼요. 삽화가 단순한 설명 도구를 넘어 내 브랜드 IP를 쌓는 자산이 될 수 있다는 거예요.

누가 써보면 좋을까요?

콘텐츠를 정기적으로 발행하는 1인 운영자, 기술 블로그를 쓰는 개발자나 PM, Notion으로 문서를 많이 만드는 분에게 잘 맞아요. 복잡한 개념을 자주 설명해야 하는 상황이라면 특히 유용하고요.

Claude Code나 Codex에 스킬을 붙이면 워크플로우 안에 자연스럽게 녹아들어요. 당장 내 글에서 "독자가 가장 헷갈릴 지점"을 파악하고 싶다면, 스킬의 인지 앵커 추출 단계만 써봐도 재미있는 시각을 얻을 수 있어요.

자주 묻는 질문

Q. 삽화를 생성하려면 별도 이미지 생성 모델이 필요한가요?

Codex 스킬 자체는 어떤 이미지 모델을 쓸지 강제하지 않아요. 기존에 사용 중인 이미지 생성 도구(gpt-image-2, Higgsfield, Stable Diffusion 등)와 연계해서 쓰는 방식이에요. 모델 선택은 사용자가 직접 결정하면 돼요.

Q. MIT 라이선스이면 상업 프로젝트에도 쓸 수 있나요?

네, 자유롭게 사용·수정·재배포가 가능해요. 단, 저작권 고지는 유지해야 해요. 정확한 조건은 원본 repo의 라이선스 파일에서 확인하세요.

Q. 한국어판과 원본의 시각 스타일이 달라지나요?

시각 스타일(순백 배경·소흑·손그림 선)은 동일해요. 한국어판의 차별점은 주석 언어 지원(한국어/영어)과 내 캐릭터 교체 기능이에요. 삽화의 미학적 정체성은 원본 그대로 유지돼요.

정리하면

소흑 삽화 스킬은 그림을 잘 못 그리는 분도, 일러스트 의뢰 예산이 없는 1인 기업도 글에 삽화를 붙이고 싶다는 생각을 현실로 만들 수 있는 도구예요. 무엇보다 "AI에게 그림 한 장 시킨다"가 아니라, "내 글이 독자에게 어떤 인지 부담을 주는지 먼저 파악하고, 그 지점을 시각화한다"는 사고방식 자체가 콘텐츠를 만드는 방식을 조금 다르게 보게 만들어요.

한국어판은 내 캐릭터를 입혀 브랜드 자산으로 쌓을 수 있고, Claude Code·Codex 스킬로 붙여 쓰면 기존 에이전트 워크플로우에 자연스럽게 녹아들어요. 관심 있으신 분은 아래 GitHub 링크에서 직접 살펴보세요.

참고 자료