【新芒xAI】谷歌升级AI创作工具，Gemini Omni主打对话式视频编辑

新芒xAI 7月1日消息，据36氪快讯援引新浪财经报道，谷歌在近期举行的I/O开发者大会上宣布一系列面向开发者的AI创作工具升级，目标是借助最新Gemini模型家族降低多媒体内容生成门槛、提升创作效率。其中，谷歌发布全新的Gemini Omni模型，能够理解并处理文本、图像、音频和视频输入，并生成连贯的视频内容；其突出特点是支持对话式编辑，用户可用自然语言提出“更换角色”“调整光线”“改变场景”等修改需求，由模型自动完成编辑。

这条快讯与今天已发布的Google多模态模型消息属于同一产品线，但更聚焦创作工具层面的落地方式：从单纯生成图像或视频，向“可对话、可修改、可迭代”的多模态内容生产流程靠近。由于相关细节仍来自媒体报道，具体开放范围、API价格、开发者可用时间和生成内容版权规则，还需要等待谷歌后续官方文档和开发者平台信息进一步确认。

来源：36氪。

关键要点

Gemini Omni强化多模态输入输出。快讯称，该模型可处理文本、图像、音频和视频输入，并生成连贯视频内容。
对话式编辑成为核心卖点。用户不需要复杂剪辑指令，而是通过自然语言描述修改目标，让模型自动完成视觉调整。
开发者工具属性更强。谷歌将其放在I/O开发者大会语境下发布，意味着重点不只是消费者演示，而是面向创作者和应用开发者的能力集成。
落地细节仍需继续观察。模型开放节奏、价格、可商用限制和内容安全规则，都会决定它能否真正进入生产流程。

【新芒xAI评论】

新芒xAI认为，Gemini Omni这类模型的重点在于把AI视频从“一次生成”推进到“连续编辑”。如果用户可以像和剪辑师沟通一样修改角色、灯光和场景，多媒体创作门槛会明显下降，广告、电商、教育和短视频团队都有可能受益。

但风险也很现实：第一，对话式视频编辑会进一步放大深度伪造、肖像滥用和版权争议；第二，生成内容是否足够稳定、是否能保持角色和镜头一致性，仍是商业可用的关键瓶颈；第三，低门槛创作可能带来大量同质化内容，反而增加平台审核和品牌辨识难度。对谷歌来说，技术展示只是第一步，真正的竞争点在于能否把多模态能力做成可靠、合规、可控的创作基础设施。

打赏

【新芒xAI】谷歌升级AI创作工具，Gemini Omni主打对话式视频编辑

关键要点

【新芒xAI评论】

作者: 新芒Group

微信扫一扫关注我们