谷歌AI模式来袭Perplexity如何应对

又是一年谷歌I/O开发者大会,AI交响乐再次奏响。去年,”AI”一词在谷歌I/O大会上被提及120次,今年虽降至92次,但依然是绝对主角。其中最受瞩目的,莫过于谷歌将AI深度融入搜索及Chrome浏览器,开启全新篇章。

谷歌搜索将不再满足于生成”谷歌摘要”,而是新增”AI模式”标签,直接在结果分类中展示类似独立AI搜索应用的效果。Chrome浏览器将加入Gemini AI助手,未来可跨多个标签页工作,代表用户浏览网站。这是谷歌对近期争议的直接回应。一方面,谷歌搜索面临挑战。苹果高管声称谷歌搜索受到Perplexity、ChatGPT等竞品的挑战,Safari浏览器搜索量(默认使用谷歌搜索)出现2022年以来首次下降。另一方面,AI初创公司正虎视眈眈,Perplexity即将发布浏览器,OpenAI甚至传出收购Chrome的传言。谷歌对搜索和浏览器的进一步升级,彰显其”继续伟大”的决心。

谷歌AI模式来袭Perplexity如何应对

本次谷歌I/O大会亮点纷呈,还包括安卓XR平台最新进展、3D视频聊天项目升级、文生图工具Imagen和文生视频工具Veo的升级、AI电影制作应用推出、Project Astra更加主动等。谷歌几乎要用AI重新定义所有产品。

01 谷歌搜索的”AI模式”与Chrome的Gemini

谷歌AI模式来袭Perplexity如何应对

去年I/O大会上,谷歌推出搜索中的”AI摘要”功能,在搜索结果顶部生成AI摘要,帮助用户快速了解内容。但AI摘要也面临挑战,如幻觉问题。今年谷歌更进一步,宣布添加”AI模式”。”AI模式”将与”全部””图像””咨询”等分类并列,位于首位,在搜索框下部显示。用户用自然语言提出搜索请求,模型直接生成总结式回答,以图文形式展示,并在右侧提供相关网页。该模式使用谷歌前沿模型,并采用”查询扇出”技术,将用户查询分解为多个子主题并行搜索,实现比传统搜索更深入的搜索体验。这既是对Perplexity、ChatGPT等挑战者的回应,也是对自身关键词-网页结果搜索逻辑的颠覆。

Chrome浏览器将接入Gemini AI助手。点击右上角图标,即可打开Gemini聊天机器人窗口,可移动调整大小,询问网站相关问题。最初,用户可在浏览各标签页时使用Gemini对话,未来将支持选择多个标签页提问。更进一步,Gemini将能直接代劳浏览网页。演示中,Gemini帮助浏览食谱网站,可快速跳转到配料部分,将糖量从杯转换为克。未来想象空间依然留给AI Agent。

谷歌AI模式来袭Perplexity如何应对

02 谷歌助手走开,Gemini助手上位

谷歌推出Gemini助手,展现对”超级助手”的期待。谷歌助手(Google Assistant)虽存在已久,但Gemini应用正成为未来助手的核心。Gemini Live是”助手”角色的绝佳体现,用户无需描述所见或发送图片,可直接让AI”看到”屏幕或周遭事物,像真正的小帮手一样排忧解难。Gemini Live具有摄像头和屏幕共享功能,现已可在Android和iOS上免费使用,用户可通过语音与任何物体交谈。

谷歌AI模式来袭Perplexity如何应对

谷歌宣布将Frontier Gemini 2.5 Pro模型扩展为”世界模型”,使其能理解所见事物并制定计划。DeepMind首席执行官Demis Hassabis表示,这些更新是构建”通用AI助手”的关键步骤,可更好地理解用户并代表他们采取行动。Gemini Live是对Project Astra的延伸,一个利用视觉感知周围世界的AI代理。本次I/O大会上,Project Astra变得更加主动,可根据所见内容完成任务,即使没有明确要求。

谷歌勾勒的”通用AI助手”颇具吸引力:一个可随处陪伴的助手——无论是在手机里,还是在一副增强现实眼镜里——能在几秒钟内感知世界、回答问题并向你传递信息。

谷歌AI模式来袭Perplexity如何应对

03 Gemini其实是个艺术家

创意专业人士和程序员请注意:谷歌对创意工具的增强将改变你的工作方式。值得关注的有两个迭代和两个新产品。首先说迭代。谷歌对图像生成模型和视频生成模型进行了升级,分别推出Imagen 4和Veo 3。Imagen 4能渲染织物、水滴和动物毛发等精细细节,支持照片级写实和抽象风格,可创建各种宽高比、分辨率高达2K的图像。Josh Woodward表示,Imagen 4非常适合制作幻灯片、邀请函等融合图像和文字的内容。在众多AI图像工具中,Imagen 4的竞争力在于速度,比Imagen 3更快,未来还将推出速度更快10倍的变体。Veo 3是OpenAI Sora的竞品,其视频+音频输出可生成带声音的视频,如鸟鸣音频的鸟类视频或带交通噪音的城市街道视频。这并非自动配音工具,但谷歌对其效果充满信心。Veo 3在真实世界物理和唇形同步方面也表现出色。

谷歌AI模式来袭Perplexity如何应对

再说新产品。谷歌推出全新产品Flow,定义其为”AI电影制作工具”。Flow整合Veo、Imagen和Gemini,打造电影级剪辑和场景。用户用自然语言描述最终效果,Flow立即制作。具体来说,用户可使用文本转视频提示和素材转视频提示等功能,制作时长8秒的AI生成短片,再使用场景构建工具拼接多个短片。谷歌提供的案例显示,Flow制作的电影时长数分钟,人物、背景、质感都相当稳定。另一个新产品是”异步编码代理”Jules,旨在将餐巾纸上的粗略设计变成完整代码或图形设计,并展示工作过程。

04 XR眼镜怎么能少了我谷歌?

谷歌AI模式来袭Perplexity如何应对

安卓XR(Android XR)的最新进展是本次I/O大会的另一亮点。该系统专为XR头显、智能眼镜等设备设计,通过与AI深度整合实现”无接触辅助”功能。谷歌盯上XR生态并不令人意外。安卓系统是智能手机时代最重要的底层操作系统之一,而XR设备被视为下一代智能终端的潜力股。此前Meta曾想开发XR操作系统,但未能成功。谷歌希望在增强现实、混合现实和虚拟现实领域实现Android在智能手机领域的成就。

这次,谷歌将与Gentle Monster、Warby Parker等眼镜品牌合作,推出更多时尚设计的智能眼镜产品,并与开云眼镜等更多合作伙伴展开联动。为进一步推动技术生态,谷歌将深化与三星的合作,联合打造专为眼镜类设备设计的软硬件参考平台,预计今年晚些时候向开发者提供适配支持。值得一提的是,中国科技公司Xreal发布了Project Aura,这是搭载Android XR平台的第二款官方设备。谷歌和Xreal计划在2025年6月的增强现实世界博览会(AWE)上公布更多关于Project Aura的消息。

文章网址:https://www.wpbull.com/ai/29745.html