Google Flow 于 2026 年 3 月发布,将 Whisk 和 ImageFX 整合进了一个统一的 AI 创作工作区。搭配 Veo 3.1 模型更新(原生音频、起止帧控制、片段延伸、1080p),Flow 成为目前主流厂商中集成度最高的图像转视频平台。
之前需要在三个独立 Google 工具之间切换的工作,现在全部在一个界面内完成。套索选取加自然语言编辑是一种全新的交互方式:框选目标区域,输入修改指令,模型自动处理。
相关阅读:在 AI 视频生成器 对比视频工具,查看 AI 图像生成器 了解图像流程,或阅读 2026 最佳 AI 视频工具。
什么是 Google Flow?
Flow 是 Google 的统一 AI 创作工作区,通过 Google Labs 免费提供。它整合了三个原本独立的产品:
- Whisk(图像混合与风格迁移)
- ImageFX(文本生成图像)
- Veo(文本/图像生成视频)
核心理念:在一个工具内完成整个创作流程。从文本提示生成底图,用套索工具做局部编辑,转换为视频,延长片段,添加镜头运动,生成音轨,导出成品。
Flow 在浏览器中运行,无需下载或本地 GPU。通过 labs.google/flow 用 Google 账号登录即可使用。
Veo 3.1 新功能
Veo 3.1 随 Flow 工作区一同发布,重点提升可控性和输出质量。
| 功能 | 说明 |
|---|---|
| 原生音频生成 | 视频生成时同步生成匹配音频,非后期单独处理 |
| 起止帧控制 | 指定精确的起始和结束帧,控制场景过渡和视觉连贯性 |
| 片段延伸 | 通过链式扩展将片段延长至 8 秒以上 |
| 1080p 输出 | 全高清分辨率,此前默认 720p |
| 物理仿真增强 | 改进重力、流体、布料和物体交互的模拟效果 |
| 镜头运动编排 | 通过文字提示指定平移、倾斜、缩放、推轨等镜头运动 |
| 空间音频 | 音频输出反映场景中声源的空间位置 |
| LTX Studio API | 通过 LTX Studio 提供开发者和企业级 API 接入 |
原生音频是最重要的新增功能。砾石路面上的脚步声和瓷砖地面上的不同,汽车怠速和加速时的引擎声也有区别。
Flow 的编辑工具
Flow 的编辑层是它区别于独立生成器的关键,同时支持图像和视频帧编辑。
套索选取 + 自然语言编辑
在任意对象或区域周围画一个自由选区,然后输入自然语言指令:
- 框选衬衫,输入"改为深蓝色牛仔布质感"
- 框选天空,输入"戏剧性的橙紫色晚霞"
- 框选人脸,输入"添加一副阅读眼镜"
对象添加和移除
用文字描述需要添加或移除的元素:
- "在画面左侧添加一只坐着的金毛犬"
- "移除背景中的汽车"
Flow 会自动处理光照、阴影和透视匹配。
镜头运动控制
生成或延伸视频时,通过文字指定镜头行为:
- "缓慢推镜头靠近主体"
- "从左到右平移扫过风景"
- "升降镜头从城市上方升起"
风格迁移和片段串联
在帧或整个片段上应用视觉风格,同时保持主体一致性。多个生成片段可以在 Flow 内串联成完整序列,过渡点自动保持视觉连贯。
Google Flow 对比竞品
以下为 2026 年 3 月各主流 AI 创作工具对比。
| 功能 | Google Flow | Runway Gen-4 | Pika 2.1 | CapCut AI |
|---|---|---|---|---|
| 图像生成 | 内置 (ImageFX) | 不支持(仅导入) | 不支持(仅导入) | 基础模板 |
| 视频生成 | Veo 3.1 | Gen-4 Turbo | Pika 2.1 | Seedance 2.0 |
| 工具内编辑 | 套索 + 自然语言 | 画笔 + 关键帧 | 运动画笔 | 时间轴编辑器 |
| 原生音频 | 支持 | 不支持(需单独步骤) | 不支持 | 音乐库 |
| 统一工作区 | 是 | 部分 | 否 | 是(侧重不同) |
| 最高分辨率 | 1080p | 4K(放大后) | 1080p | 1080p |
| 定价 | 免费 (Google Labs) | $12/月起 | $8/月起 | 免费版 + Pro |
| 最适合 | 端到端创作 | 电影级画质 | 快速社交短片 | 重编辑工作流 |
Flow 最大的优势是统一工作区:从概念到导出全程无需切换工具。主要局限在于 Runway 的独立生成画质仍然更高,且提供更细粒度的专业镜头构图控制。
Veo 3.1 API 接入
开发者可通过两种途径使用 Veo 3.1:
Google Cloud / Gemini API:Veo 3.1 作为 Gemini 模型家族的一部分提供。需要开通生成式 AI API 的 Google Cloud 项目。截至 2026 年 3 月,具体价格尚未公开定稿。
LTX Studio 合作:LTX Studio 集成了 Veo 3.1 作为可用的视频生成后端,为开发者在原始生成能力之上增加了分镜级编排。
常见问题
Google Flow 是免费的吗?
是的。Flow 目前通过 Google Labs 免费提供,尚未公布付费方案。使用量可能受每日生成上限限制。
Veo 3.1 与 Sora 相比如何?
两者定位相似但集成方式不同。Veo 3.1 嵌入 Flow 统一工作区(含图像生成和编辑),Sora 作为独立视频生成器在 ChatGPT 内运行。Veo 3.1 的原生音频生成是 Sora 目前不具备的功能。
可以将 Flow 用于商业项目吗?
Google Labs 产品通常允许个人和实验性使用。截至 2026 年 3 月,Flow 输出的商业授权尚未明确说明,使用前请查阅 Google 当前服务条款。
Whisk 和 ImageFX 怎么了?
两个产品已被整合进 Google Flow。Whisk 的图像混合和风格迁移功能现在是 Flow 的编辑工具,ImageFX 的文生图功能是 Flow 的图像创建层。独立版本正在逐步停用。
Flow 支持 4K 输出吗?
目前不支持。Veo 3.1 最高输出 1080p。如需 4K,需要使用 Topaz 或 Runway 放大器等外部工具进行超分辨率处理。
可以通过 API 使用 Veo 3.1 吗?
可以。通过 Google Cloud 生成式 AI API 或 LTX Studio 的 API 集成均可访问,支持文生视频和图生视频两种模式。
相关文章
- Veo 3 工具页 - 模型规格和功能
- 2026 最佳 AI 视频工具 - 全面的工具对比
- AI 视频制作完整指南 - 端到端制作工作流
- 2026 最佳 AI 图像生成器 - 流程中的图像生成工具
- 提示词翻译工具 - 跨模型优化提示词

