YouTube 채널 운영은 리서치, 스크립팅, 촬영, 편집, 썸네일, SEO, 자막, 멀티 플랫폼 배포를 동시에 처리하는 일이다. 에이전트 스킬은 이 루프의 반복적인 부분을 처리하여 시청자를 늘리는 크리에이티브한 결정에 집중할 수 있게 해준다. 이 가이드에서는 시간 절약 효과가 높은 워크플로 단계별로 12개의 가장 유용한 스킬을 소개한다.
이 글은 영상 제작을 위한 최고의 에이전트 스킬 허브의 일부입니다. 전체 스킬 카탈로그는 허브를 참조.
12개 스킬 한눈에 보기
| 워크플로 단계 | 스킬 | 기능 | 설치 |
|---|---|---|---|
| 리서치/스크립팅 | aivp-script | 주제 리서치에서 구조화 스크립트 생성 | npx skills add aivp-script |
| 리서치/스크립팅 | prompt-architect | AI 리서치용 최적화 프롬프트 생성 | npx skills add prompt-architect |
| 썸네일/비주얼 | canvas-design | 텍스트 오버레이 포함 AI 썸네일 생성 | npx skills add canvas-design |
| 썸네일/비주얼 | aivp-image | 썸네일 배치의 일관된 비주얼 스타일 유지 | npx skills add aivp-image |
| 영상 제작 | ffmpeg-editing | 영상 컷, 트림, 변환, 배치 처리 | npx skills add ffmpeg-editing |
| 영상 제작 | remotion | 프로그래매틱 인트로, 아웃트로, 애니메이션 오버레이 | npx skills add remotion |
| 나레이션/오디오 | elevenlabs-voice | 클론 또는 프리셋 보이스로 TTS 나레이션 생성 | npx skills add elevenlabs-voice |
| 나레이션/오디오 | aivp-audio | BGM, 효과음, 오디오 믹싱 | npx skills add aivp-audio |
| SEO/메타데이터 | seo-optimizer | 제목, 설명, 태그, 스키마 마크업 최적화 | npx skills add seo-optimizer |
| SEO/메타데이터 | transcript-fixer | 자동 생성 자막 정리 | npx skills add transcript-fixer |
| 퍼블리싱 | youtube-clipper | 긴 영상에서 하이라이트를 Shorts용으로 추출 | npx skills add youtube-clipper |
| 퍼블리싱 | social-content | TikTok, Instagram, X용으로 콘텐츠 리퍼포싱 | npx skills add social-content |
1. 리서치와 스크립팅
편집기를 열기 전에 데이터에 기반한 주제와 시청 유지율에 최적화된 스크립트가 필요하다.
aivp-script
aivp-script는 주제나 작업 제목을 받아 구조화된 영상 스크립트를 생성한다. 트렌드 데이터, 경쟁 영상 분석, 키워드 볼륨을 활용하여 아웃라인을 구성한다.
npx skills add aivp-script결과물: 처음 30초 리텐션 절벽에 최적화된 훅 섹션, B롤 큐와 토킹 포인트가 포함된 본문, CTA 블록, 추정 재생 시간.
prompt-architect
prompt-architect는 리서치 어시스턴트다. 주제, 오디언스, 콘텐츠 포맷에 기반하여 AI 도구용 최적화 프롬프트를 생성한다.
npx skills add prompt-architect관련: 무료 프롬프트 생성기로 빠른 프롬프트 구축, 바이럴 YouTube 프롬프트 가이드에서 플랫폼별 템플릿 확인.
2. 썸네일과 비주얼 디자인
썸네일은 클릭률에 가장 큰 영향을 미치는 요소다.
canvas-design
canvas-design은 브랜드 일관성이 있는 AI 썸네일을 생성한다. 브랜드 설정(색상, 폰트, 로고 위치, 텍스트 오버레이 스타일)을 한 번 정의하면 이후 모든 썸네일에 적용된다.
npx skills add canvas-design출력: 텍스트 오버레이가 포함된 1280x720 PNG/JPG 썸네일.
aivp-image
aivp-image는 배치 전체의 비주얼 일관성에 초점을 맞춘다. 시리즈 제작 시 스타일 레퍼런스를 유지하여 47번째 썸네일이 1번째와 같은 룩을 갖도록 한다.
npx skills add aivp-image3. 영상 제작과 편집
원본 영상과 AI 생성 클립은 업로드 전에 컷, 포맷팅, 합성이 필요하다.
ffmpeg-editing
ffmpeg-editing은 FFmpeg 명령어를 읽기 쉬운 스킬 인터페이스로 변환한다. FFmpeg 플래그를 외우는 대신 "2:30부터 5:15까지 트림, 0.5초 페이드인 추가, 1080p MP4로 내보내기"라고 기술하면 된다.
npx skills add ffmpeg-editingremotion
remotion은 Remotion 프레임워크로 프로그래매틱 영상 요소를 구축한다: 애니메이션 인트로, 로어 서드, 구독 오버레이, 엔드 스크린.
npx skills add remotion관련: AI 영상 도구 전체 목록에서 더 많은 제작 도구 확인.
4. 나레이션과 오디오
오디오 품질이 아마추어 채널과 프로 채널의 차이를 만든다.
elevenlabs-voice
elevenlabs-voice는 ElevenLabs API로 TTS 나레이션을 생성한다. 프리셋 보이스 사용이나 자신의 목소리 클론이 가능하다.
npx skills add elevenlabs-voice주요 기능: 30초 샘플로 보이스 클론, 페이싱 제어, 섹션별 감정/톤 조정, 자동 SRT 자막 생성, 다국어 지원.
aivp-audio
aivp-audio는 오디오 레이어의 나머지 모든 것을 처리한다: BGM 선택, 효과음 배치, 볼륨 밸런싱, 최종 믹스.
npx skills add aivp-audio5. SEO와 메타데이터
훌륭한 영상도 메타데이터가 부실하면 묻힌다.
seo-optimizer
seo-optimizer는 최적화된 제목, 설명, 태그, 스키마 마크업을 생성한다.
npx skills add seo-optimizer관련: AI 자막 생성기 가이드에서 캡션 옵션 확인.
transcript-fixer
transcript-fixer는 YouTube나 Whisper의 자동 생성 자막을 정리한다. 구두점 추가, 기술 용어 교정, 읽기 쉬운 2줄 세그먼트 분할, 자연스러운 읽기 속도로 타이밍 조정을 수행한다.
npx skills add transcript-fixer6. 퍼블리싱과 리퍼포싱
하나의 장편 영상은 여러 플랫폼에서 5-10개의 콘텐츠가 되어야 한다.
youtube-clipper
youtube-clipper는 장편 영상에서 최적의 세그먼트를 추출하여 YouTube Shorts 포맷으로 변환한다.
npx skills add youtube-clipper동작: 전체 영상의 참여 피크 분석, 3-5개 클립 후보 제안, 9:16 세로형 크롭, 자막 추가, Shorts용 MP4 내보내기.
social-content
social-content는 YouTube 영상을 TikTok, Instagram Reels, X용으로 리퍼포싱한다.
npx skills add social-content관련: 프롬프트 번역기로 다국어 콘텐츠 적응.
워크플로 예시: 주제에서 퍼블리싱까지
"2026년 모든 유튜버에게 필요한 무료 AI 도구 5선" 제작 워크플로.
1단계: 리서치와 스크립트(aivp-script) 로 주제를 구조화 스크립트로 변환.
2단계: 나레이션 생성(elevenlabs-voice) 으로 스크립트를 클론 보이스로 음성화.
3단계: 썸네일 생성(canvas-design) 으로 브랜드 통일 썸네일 생성.
4단계: 메타데이터 최적화(seo-optimizer) 로 제목, 설명, 태그 최적화.
5단계: Shorts 추출(youtube-clipper) 로 본편에서 3개의 Short 추출.
총 소요 시간: 편집과 리뷰에 약 30분의 핸즈온 작업. 스킬이 처리하는 반복 작업은 약 3-4시간에 해당.
FAQ
에이전트 스킬을 사용하려면 코딩 경험이 필요한가?
불필요하다. npx skills add [name]으로 설치하고 Claude Code에서 슬래시 명령으로 호출한다. 자연어로 지시를 작성하며, 터미널 기본 사용법만 알면 된다.
Codex 등 다른 에이전트에서도 사용 가능한가?
스킬은 오픈 SKILL.md 표준을 따른다. Claude Code가 네이티브 지원하고, OpenAI Codex 등도 Markdown 지시 파일을 읽을 수 있다.
에이전트 스킬 실행 비용은?
스킬 자체는 무료. 비용은 기반 API에서 발생: ElevenLabs는 글자당 과금, AI 이미지 생성은 생성 횟수당 과금. 일반적인 영상 제작 실행(스크립트 + 나레이션 + 썸네일 + 메타데이터) 시 API 비용 $2-5.
기존 YouTube 워크플로와 통합할 수 있나?
가능하다. 각 스킬은 독립적으로 동작한다. 가장 시간을 절약하는 스킬(보통 seo-optimizer나 youtube-clipper)부터 시작해서 점진적으로 확장할 수 있다.
채널별 니즈에 맞게 스킬을 커스터마이즈할 수 있나?
모든 스킬은 편집 가능한 SKILL.md 파일이다. 브랜드 가이드라인, 선호 톤, 기본 설정을 파일에 직접 추가할 수 있다. Claude Code 스킬 튜토리얼 참조.

