在 Veo Omni 上的 Gemini Omni Video — 一体化多模态 AI 视频生成器
Gemini Omni Video 是 Google 新推出的多模态 AI 视频模型,而 Veo Omni 让你可以通过一个输入框来运行它。上传参考图像、音频轨道或视频片段,编写简短提示,Gemini Omni Video 会创建或优化跟随每个输入的剪辑。一次 Gemini Omni Video 生成处理所有模态 — 无需单独的工具,无需额外帐户。
在一次 Gemini Omni Video 生成中实现多模态引用
Gemini Omni Video 可以以任意组合读取文本、图像、音频和视频输入。添加参考照片以获得视觉风格,插入视频剪辑以获取动态,或添加音轨以获得节奏 — Gemini Omni Video 将每种模态融合为一个单一的 Veo Omni 剪辑,无需同时使用多个 AI 工具。
使用Gemini Omni Video进行参考指导的视频编辑
上传现有视频,让 Gemini Omni Video 用新的引用进行编辑。通过使用样式图像来更换外观,用音乐剪辑替换音轨,或使用另一个视频重新映射动作。Gemini Omni Video 在 Veo Omni 上重新渲染剪辑,同时保持未触及部分的稳定。
使用 Gemini Omni Video 的风格和运动转移
给 Gemini Omni Video 提供参考图像以获取视觉风格和参考剪辑以进行镜头移动,Gemini Omni Video 会将它们融合到你自己的视频中。非常适合匹配品牌风格、复制热门剪辑或重现电影镜头 — 所有这些都在一次 Gemini Omni Video 生成中完成,使用 Veo Omni。
来自 Gemini Omni Video 的自然动作、声音和口型同步
早期的Gemini Omni Video演示展示了干净的口型同步、逼真的声音和流畅的摄像工作。向Gemini Omni Video输入一个肖像和一个音轨,你将得到一个嘴巴与言语匹配的脱口秀剪辑;加载一个产品参考,Gemini Omni Video将呈现一个稳固的现实镜头,保持每一帧统一。
如何在 Veo Omni 上使用 Gemini Omni Video
上传你的引用
提供Gemini Omni Video需要读取的输入——参考图像、音频轨道、视频剪辑或任意组合。Gemini Omni Video允许你自由混合模态,因此你可以仅提供一个参考或同时叠加多个。
描述你想要的内容
写下简短的提示,告诉Gemini Omni Video要生成什么或如何完善剪辑。Gemini Omni Video将你的提示与上传的参考相结合,规划完整的镜头——运动、灯光、身份和时机。
生成并下载
点击生成,Gemini Omni Video 在 Veo Omni 上渲染剪辑。预览结果,替换引用或调整提示以迭代,并下载完成的 Gemini Omni Video 剪辑,为你的下一个项目做好准备。
Gemini Omni Video FAQ — 关于 Google 多模态 AI 视频模型的所有信息
什么是 Gemini Omni Video?
Gemini Omni Video 是 Google 新推出的多模态 AI 视频模型。Gemini Omni Video 通过读取文本提示、参考图像、音频轨道和视频剪辑来生成和编辑视频。与旧的 AI 视频工具逐个处理每种模态不同,Gemini Omni Video 将它们统一,从而一次生成涵盖你的全部意图。
Gemini Omni Video 与 Veo 3.1 有何不同?
Veo 3.1 专注于具有原生音频的电影化文本到视频生成。Gemini Omni Video 更进一步,除了文本提示外,还接受图像、音频和视频引用,并处理基于引用的编辑 — 不仅仅是生成。这两个模型都在 Veo Omni 内部,您可以通过一次点击进行切换。
Gemini Omni Video 何时会推出?
谷歌尚未正式推出Gemini Omni Video。Gemini Omni Video首次出现在2026年5月的Gemini应用测试中,预计将在2026年Google I/O上揭晓。首次访问可能与付费Gemini计划相关,并有限的免费试用。
Gemini Omni Video 支持哪些输入?
Gemini Omni Video 支持四种引用类型,您可以进行组合:文本提示、参考图像、音频轨道和参考视频。单独使用文本,为风格叠加图像,添加音频以获得节奏或声音,或提供视频剪辑以获得动态 — Gemini Omni Video 可读取这些模态的任意子集。
Gemini Omni Video 能否编辑我已有的视频?
可以。上传您现有的剪辑,向 Gemini Omni Video 提供描述更改的参考输入——风格图像、音乐轨道或其他参考视频。Gemini Omni Video 会根据这些参考重新渲染剪辑,同时保持未触及部分的稳定。
Gemini Omni Video 包含声音和同步口型吗?
早期的 Gemini Omni Video 演示展示了自然的声音和准确的口型同步。提供一张肖像和一个音频参考,Gemini Omni Video 会生成一个口型与语言匹配、声音听起来人性化的讲述者剪辑。
我可以将 Gemini Omni Video 用于广告或社交媒体吗?
可以。Gemini Omni Video 非常适合短广告、产品演示和社交短片。向 Gemini Omni Video 提供品牌风格的参考图像,以确保一致的外观,然后为不同平台重混变体,而无需重新拍摄任何内容。
Gemini Omni Video 在 Veo Omni 上是免费的吗?
在谷歌方面,Gemini Omni Video预计将在付费的Gemini等级中作为一项高级功能推出,且免费使用有限。在Veo Omni中,您可以使用积分运行Gemini Omni Video——购买积分包或者邀请朋友来获得免费的Gemini Omni Video生成。
哪种视频最适合与 Gemini Omni Video 一起使用?
对于 Gemini Omni Video,最佳短剪辑是有一个清晰焦点的:一个人在说话,桌子上的产品,或两三种动作的快速场景。Gemini Omni Video 能够很好地处理现实的运动和光照,当您想要一个与特定图像、音轨或运动源匹配的剪辑时,基于参考的工作流程表现出色。
在Veo Omni上使用Gemini Omni Video开始创作
通过上传任意组合的文本、图像、音频和视频参考,使用Gemini Omni Video生成AI视频。从头开始创建、重混您已有的素材,并发布精美的短视频——这些都可以在Veo Omni的一个Gemini Omni Video模型中完成。