AI 【新芒xAI】谷歌升级AI创作工具,Gemini Omni主打对话式视频编辑

【新芒xAI】谷歌升级AI创作工具,Gemini Omni主打对话式视频编辑

新芒xAI 7月1日消息,据36氪快讯援引新浪财经报道,谷歌在近期举行的I/O开发者大会上宣布一系列面向开发者的AI创作工具升级,目标是借助最新Gemini模型家族降低多媒体内容生成门槛、提升创作效率。其中,谷歌发布全新的Gemini Omni模型,能够理解并处理文本、图像、音频和视频输入,并生成连贯的视频内容;其突出特点是支持对话式编辑,用户可用自然语言提出“更换角色”“调整光线”“改变场景”等修改需求,由模型自动完成编辑。

这条快讯与今天已发布的Google多模态模型消息属于同一产品线,但更聚焦创作工具层面的落地方式:从单纯生成图像或视频,向“可对话、可修改、可迭代”的多模态内容生产流程靠近。由于相关细节仍来自媒体报道,具体开放范围、API价格、开发者可用时间和生成内容版权规则,还需要等待谷歌后续官方文档和开发者平台信息进一步确认。

来源:36氪

关键要点

  • Gemini Omni强化多模态输入输出。快讯称,该模型可处理文本、图像、音频和视频输入,并生成连贯视频内容。
  • 对话式编辑成为核心卖点。用户不需要复杂剪辑指令,而是通过自然语言描述修改目标,让模型自动完成视觉调整。
  • 开发者工具属性更强。谷歌将其放在I/O开发者大会语境下发布,意味着重点不只是消费者演示,而是面向创作者和应用开发者的能力集成。
  • 落地细节仍需继续观察。模型开放节奏、价格、可商用限制和内容安全规则,都会决定它能否真正进入生产流程。

【新芒xAI评论】

新芒xAI认为,Gemini Omni这类模型的重点在于把AI视频从“一次生成”推进到“连续编辑”。如果用户可以像和剪辑师沟通一样修改角色、灯光和场景,多媒体创作门槛会明显下降,广告、电商、教育和短视频团队都有可能受益。

但风险也很现实:第一,对话式视频编辑会进一步放大深度伪造、肖像滥用和版权争议;第二,生成内容是否足够稳定、是否能保持角色和镜头一致性,仍是商业可用的关键瓶颈;第三,低门槛创作可能带来大量同质化内容,反而增加平台审核和品牌辨识难度。对谷歌来说,技术展示只是第一步,真正的竞争点在于能否把多模态能力做成可靠、合规、可控的创作基础设施。

文章来源信息声明: 本文信息出自权威媒体、企业官方及网络,并经新芒X编辑,转载请注明源出处、作者和链接。 图片部分来源于网络,在此表示感谢,如有侵权请联系我方处理。 文章发布日期后方火形图标后的数字,为文章热度,谨代表受欢迎程度。 新芒X平台仅对用户提供信息及决策参考,本文不构成投资建议。

作者: 新芒Group

新芒出品,专注专业。兼具内容品质和传播影响力
关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部