代理技能是 SKILL.md 格式的指令文件,AI 编码代理可以解析并自主执行其中的任务。截至 2026 年 3 月,该生态系统已从代码生成扩展到专业视频制作工作流。本指南将 18 个技能映射到 AI 视频流水线的 9 个阶段,附带安装命令。
如果你已在使用 Claude Code、Codex CLI 或 Cursor,这些代理现在也能处理脚本编写、图像生成、视频剪辑、音频制作和发布。
快速参考表
| 阶段 | 推荐技能 | 功能 | 安装 |
|---|---|---|---|
| 脚本 | aivp-script | 结构化视频脚本 | npx skills add aivp-script |
| 分镜 | aivp-storyboard | 脚本转镜头列表 | npx skills add aivp-storyboard |
| 图像 | fal-generate | fal.ai 图像生成 | npx skills add fal-generate |
| 视频 | ai-video-generation | 多模型视频生成 | npx skills add ai-video-generation |
| 剪辑 | ffmpeg-editing | FFmpeg 操作 | npx skills add ffmpeg-editing |
| 音频 | elevenlabs-voice | ElevenLabs 配音 | npx skills add elevenlabs-voice |
| 元数据 | seo-optimizer | SEO 优化元数据 | npx skills add seo-optimizer |
| 发布 | social-content | 多平台适配 | npx skills add social-content |
| 审核 | aivp-review | 自动质量检查 | npx skills add aivp-review |
什么是代理技能?
SKILL.md 文件包含 frontmatter 元数据和自然语言指令,AI 编码代理解析后自主执行。该格式由 Anthropic 为 Claude Code 引入,已被 Codex CLI、Cursor、Gemini CLI 采用。安装只需一条命令:npx skills add [技能名]。也可从 skills.sh 或 ClawHub 获取。
1. 脚本
脚本阶段将主题转化为包含旁白、场景描述和时间标注的结构化脚本。
aivp-script - 生成流水线格式脚本,输出含场景分解、旁白和时长目标的结构化 JSON。安装:npx skills add aivp-script
create-viral-content - 短视频脚本,包含吸引力开头和平台适配的行动号召。安装:npx skills add create-viral-content
2. 分镜
分镜阶段将脚本转换为视觉镜头列表。在此阶段投入时间可以减少视频阶段的重复生成。
aivp-storyboard - 将脚本转换为逐镜头分镜板,含视觉描述和镜头运动。安装:npx skills add aivp-storyboard
canvas-design - 生成品牌化缩略图、社交卡片和分镜画面。安装:npx skills add canvas-design
3. 图像生成
fal-generate - 连接 fal.ai 推理 API,访问 FLUX.2、SD3 等模型。安装:npx skills add fal-generate
aivp-image - 流水线原生步骤,读取分镜输出,批量生成场景图像。安装:npx skills add aivp-image
4. 视频生成
视频阶段将图像或文本提示词转换为视频片段,通常是 API 费用最高的阶段。
ai-video-generation - inference.sh 统一 API,支持 Seedance、Kling、Minimax。安装:npx skills add ai-video-generation
aivp-video - 读取前序输出,按场景生成视频片段。安装:npx skills add aivp-video
5. 剪辑
剪辑阶段组装片段、添加转场、叠加文字并导出成片。
ffmpeg-editing - 自然语言执行 FFmpeg:剪切、拼接、叠加、编码。安装:npx skills add ffmpeg-editing
video-toolkit - 多轨组装、音视频同步、字幕烧录、平台导出预设。安装:npx skills add video-toolkit
6. 音频
音频阶段处理配音生成、背景音乐和混音。
elevenlabs-voice - ElevenLabs API 配音,语音克隆,多语言,SRT 字幕。安装:npx skills add elevenlabs-voice
aivp-audio - 按场景配音,背景音乐,混音输出。安装:npx skills add aivp-audio
7. 元数据与 SEO
元数据阶段生成标题、描述、标签和结构化数据,决定视频是否能被发现。
seo-optimizer - SEO 标题、描述、Open Graph、Schema.org 标记。安装:npx skills add seo-optimizer
transcript-fixer - 清理自动字幕,修正格式和标点。安装:npx skills add transcript-fixer
8. 发布
发布阶段处理平台特定的格式化、上传和跨平台分发。
social-content - 平台优化版本,裁剪、文案、标签,多平台上传包。安装:npx skills add social-content
youtube-clipper - 从长视频提取高光片段,生成 Shorts 竖屏裁剪。安装:npx skills add youtube-clipper
9. 审核
审核阶段在发布前运行质量检查,发现技术问题。
aivp-review - 验证分辨率、帧率、音频电平、元数据完整性。安装:npx skills add aivp-review
prompt-architect - 审查和优化流水线提示词。安装:npx skills add prompt-architect
安装与管理
npm install -g @anthropic-ai/claude-code
mkdir -p .claude/skills
npx skills add aivp-pipeline
claude
> /aivp-pipeline topic="产品演示" platform="youtube"全流程编排使用 aivp-pipeline 主技能。
常见问题
什么是代理视频制作技能?
SKILL.md 指令文件,包含特定视频制作任务的机器可读指令。AI 代理读取后自主执行 API 调用、文件写入和命令运行,在阶段间传递输出。
如何安装代理技能?
运行 npx skills add [技能名],SKILL.md 文件下载到 .claude/skills/ 目录。也可从 GitHub 仓库或 skills.sh 获取。安装后用斜杠命令调用,如 /ffmpeg-editing。
支持哪些代理?
SKILL.md 格式与代理无关。Claude Code、Codex CLI、Cursor 均完整支持。Gemini CLI 部分支持。大多数不需要浏览器操作的技能可在所有代理上运行。
可以串联多个技能吗?
可以。aivp-pipeline 将 9 个阶段串联,每个技能的输出自动传入下一个。你也可以编写自定义编排技能。
技能免费吗?
技能本身免费开源。外部 API(ElevenLabs、fal.ai、inference.sh)各有定价。通过 inference.sh 生成 5 秒视频片段约 $0.05-0.30。
如何创建自定义技能?
编写带有 YAML frontmatter 的 SKILL.md 文件,用自然语言描述执行步骤。放置在 .claude/skills/你的技能名/SKILL.md。详见代理技能自动化指南。

