支持哪些转录和字幕格式？

技能可读取和写入 SRT、WebVTT（VTT）、ASS/SSA、纯文本和 JSON 转录格式。能够接收来自 Whisper、YouTube 自动字幕、Descript、Otter.ai、Rev 和大多数其他转录工具的输出。一键导出为任何支持的格式。

AI 语法修正的准确度如何？

AI 以高准确率修正常见转录错误 — 误听词、断句、缺失标点和大小写问题。它利用上下文语句来解决歧义修正，并保留说话人的原始措辞和用词习惯。

支持说话人分离吗？

支持。技能能够在多人转录中识别不同说话人并在整个文件中保持一致的标注。你可以指定自定义名称（如主持人、嘉宾、旁白）或让 AI 使用通用标签。当说话人有明显的语言特征时效果最佳。

转录修正支持哪些语言？

技能支持 25 种以上语言，包括英语、普通话、西班牙语、法语、德语、日语、韩语、葡萄牙语、意大利语、印地语、阿拉伯语等。每种语言使用其特定的语法规则、标点规范和字符处理以确保准确修正。

能一次处理多个转录文件吗？

可以。批量处理让你在一次操作中修正整个系列的转录文本。对所有文件应用一致的说话人标注、格式规则和时间标准。技能按文件追踪修正并生成所有修改的汇总报告。

能修复字幕时间漂移吗？

可以。时间轴调整功能检测并修正字幕逐渐偏离音频的同步漂移。它还可以调整单个提示点的时间戳、设置最小和最大显示时长，确保换行发生在自然语音停顿处。

AI 字幕修正器

修正和改善 AI 生成的转录文本和字幕 — 修正语法、时间轴、说话人识别和格式，生成专业品质的字幕

字幕修正功能

将原始 AI 生成的转录文本转化为精美的、广播级字幕，具备智能语法修正、时间轴对齐和说话人标注。

语法与标点修正

修正自动生成转录中的误听词、断句、缺失标点和大小写错误。在确保语法准确的同时保留原始说话人的语气和意图。

时间轴对齐与调整

重新同步字幕时间戳以精确匹配音频。修复漂移的时间码、调整每行显示时长，确保字幕在自然语音断句处出现和消失。

说话人识别与分离

在多人转录中标注说话人身份。添加说话人姓名或标识符（说话人 A、采访者、主持人）并格式化对话片段以提高可读性。

SRT、VTT 与 ASS 格式化

以标准字幕格式输出修正后的转录文本 — SRT 用于视频编辑器、WebVTT 用于网页播放器、ASS/SSA 用于支持定位和颜色的高级样式字幕。

多语言支持

处理英语、中文、西班牙语、法语、德语、日语、韩语和 20 多种其他语言的转录文本。针对各语言特定的语法规则、标点规范和字符集进行处理。

批量转录处理

单次操作修正多个转录文件。对整个视频系列或内容库应用一致的格式规则、说话人标注和时间轴调整。

如何修正 AI 生成的转录文本

四步使用 AI 驱动的修正功能将粗糙的自动转录文本转化为精美字幕。

安装字幕修正技能

将 AI 字幕修正技能添加到你的 Claude Code 工作空间。支持来自 Whisper、YouTube 自动字幕、Descript、Otter.ai 和其他转录服务的输入。

导入原始转录文本

加载 SRT、VTT、TXT 或 JSON 格式的原始转录文件。技能会分析错误模式、时间漂移和说话人变化，自动规划修正方案。

运行 AI 修正

执行 AI 修正流水线 — 语法修正、时间轴重新对齐、说话人标注和行长优化全部在一次处理中完成，并提供详细的修改追踪。

导出格式化字幕

以你选择的字幕格式导出修正后的转录文本。查看修改日志、逐条接受或拒绝修正，保存最终文件供视频编辑器或播放器使用。

常见问题

关于 Claude Code AI 字幕修正技能的常见问题。

字幕与配字指南

学习为 AI 生成的视频内容创建专业字幕和配字的最佳实践。

AI 视频流水线：完整 9 阶段制作指南

AI 智能体视频自动化技能

AI 视频中的角色一致性

探索更多 AI 技能

发现我们完整的 AI 智能体视频制作技能集合。

AI Video Generator

Free AI video generator — compare Seedance 2.0, Sora 2, Kling 3.0, Runway Gen-4 & more across quality, duration, creative control, pricing, and workflow fit.

AI Image Generator

Free AI image generator — create images from text prompts with Midjourney v7, FLUX.2, GPT Image, Stability AI & more. Compare quality side by side.

AI Music Generator

Free AI music generator — create songs with vocals, instrumentals & soundtracks using Suno v5, Udio 2 & more. Text-to-music with lyrics support.

AI Video Prompt Generator

AI video prompt generator — build optimized SCELA prompts for Seedance 2.0, Sora 2, Kling 3.0 & Runway Gen-4. Free tool with templates for YouTube, TikTok & Shorts.

AI Video Prompt Translator

AI video prompt translator — convert prompts between Seedance 2.0, Sora, Kling, Runway, Veo & Minimax. Automatic cross-platform prompt optimization.

Seedance 2.0 AI Video Generator

Seedance 2.0 by ByteDance — Director Mode with 12-file input, 4K output, face-lock consistency & lip-sync. Consumer access varies by Dreamina / CapCut region, with China API public beta on Volcengine.

Kling 3.0 AI Video Generator

Kling 3.0 by Kuaishou — multi-shot 4K AI video with up to 6 camera cuts, lip-sync dialogue & synchronized audio. Free 6 clips/day, Pro from $8/mo.

Sora 2 AI Video Generator

Sora 2 by OpenAI — cinematic 1080p AI video from text with Storyboard editor, physics simulation & seamless scene transitions. Plans from $20/mo.

Runway Gen-4 AI Video Generator

Runway Gen-4 & Gen-4.5 — #1 on Video Arena with cinematic 4K output, motion brush, camera controls, inpainting & Adobe Firefly integration. From ~$15/mo.

Veo 3 AI Video Generator

Veo 3 by Google DeepMind — native audio generation alongside video, vertical 9:16 for TikTok/Shorts, scene extension & Gemini API access. Free to try.

Hailuo AI Video Generator

Hailuo AI by MiniMax — ultra-fast video generation with complex character expressions, anime/ink wash/game CG art styles & generous free tier. 30-second generation.

Wan 2.6 AI Video Generator

Wan 2.6 by Alibaba — open-source AI video model you can self-host. Text-to-video, image-to-video, ComfyUI integration & community extensions. Free online.

Luma AI Dream Machine Video Generator

Luma AI Dream Machine — ultra-fast AI video generation with camera motion controls, keyframe animation & image-to-video. Free 30 generations/month, API from $0.0032/frame.

Pika AI Video Generator & Editor

Pika AI — generate and edit AI videos with Pikaffects visual FX, lip sync, scene expansion & AI sound effects. Free 250 credits/month, Standard from $8/mo.

Midjourney 7 AI Image Generator

Midjourney v7 — premium photorealistic AI images with personalized style, ultra-high resolution, variation & remix tools, and multi-image blending. Plans from ~$10/mo.

Flux 2 AI Image Generator

Flux 2 by Black Forest Labs — open-weight AI image model with fast inference, accurate text rendering & commercial-friendly licensing. Self-host or use online.

Suno 5 AI Music Generator

Suno v5 — generate full songs with vocals, lyrics & multi-instrument arrangements from text prompts. Free tier available, premium plans for commercial use.

Udio 2 AI Music Generator

Udio 2 — studio-quality AI music generation with vocal cloning, stem separation, remix tools & genre-specific fine-tuning. Audiophile-grade output quality.

Text to Video AI Generator

Text to video AI — turn text prompts into cinematic video clips. Compare Seedance, Sora, Kling, Runway & 10+ models side by side. Free to start.

Image to Video AI Generator

Image to video AI — animate photos and illustrations into 4-20s video clips with motion control, camera paths & character consistency across frames.

Video to Video AI Generator

Video to video AI — restyle, upscale & transform existing clips with AI style transfer. Convert footage to anime, cinematic, or artistic looks while preserving motion.

Text to Image AI Generator

Text to image AI — generate photorealistic or artistic images from text descriptions. Compare Midjourney v7, GPT Image, FLUX.2, and Stability AI side by side.

Image to Image AI Generator

Image to image AI — transform, upscale & restyle photos with AI-powered style transfer, inpainting, outpainting & 4x resolution enhancement. Free online tool.

Text to Music AI Generator

Text to music AI — generate royalty-free tracks, jingles & background music from text prompts. Create custom soundtracks for YouTube, podcasts & social media.

AI Voice Generator

AI voice generator — create realistic voiceovers, narration & text-to-speech in 50+ languages. Voice cloning, emotion control & video narration export.

用 AI 精准修正你的转录文本

将粗糙的自动生成字幕转化为精美的、带时间轴的字幕，支持语法修正和说话人标注。免费安装。

免费安装技能