关于大模型落地,腾讯给了两个方向:智能体和知识库
腾讯集团高级执行副总裁汤道生在会上发表演讲
打造一个“智能体”(Agent),在现阶段来说已经不是一个问题。但要打造出一个既实用又能高效解决业务流中问题的智能体,仍然是一个值得深入探讨的大问题。
面对这个行业性的“大问题”,将“产品为王”奉为圭臬的腾讯,在打造“智能体”产品的过程中,又着重考虑了哪些问题?
在日前举行的2025腾讯AI产业应用峰会上,腾讯云副总裁、腾讯云智能负责人,腾讯优图实验室负责人吴运声就腾讯云在智能体方面的技术及产品设计逻辑,做了诸多回应,并特别提及了腾讯在智能体设计上的几个“细节”:
- 智能回退
- 文档比对
- 问答对强化
关于智能回退,在真实的智能体使用中,执行到某个节点经常会需要“回头”修改前面的内容(比如行程修改等等)。腾讯云的智能体开发平台,在工作流模式下引入了一个具备“全局视野”的智能体,能够处理跨节点的回跳逻辑,并基于对整体流程结构的理解来做出判断和引导,实现一种“有意识”的交互。
关于文档比对,在很多企业场景中,同一个业务文档会存在多个版本。比如保险公司推出的寿险产品,不同年份的版本可能差异很小,但都会被上传到知识库。这会导致问答时混淆使用。而文档比对工具,使得用户可以清晰地看到不同版本之间的具体差异。
关于问答对强化,智能体在企业中的应用往往对问答的准确性有着较高要求。由于基础大模型在相同Prompt下可能产生不同的输出结果,因此,强化从文档中自动生成准确问答对的能力显得尤为重要。企业可以对这些问答对进行审核、校验,确保准确后再发布。
相比于一些智能体产品在宣发时只讲单个智能体功能,而忽视实际体验而言,吴运声对智能体研发细节上的考量,考虑到了使用智能体的“人”的真实体验:智能体不仅仅是“答”,还要在企业使用场景的现实业务中对答案负责。
吴运声认为,在 ToB 场景下,智能体的本质是一种新的应用形态。它和传统软件最核心的区别在于,具备自主规划能力,可以根据用户的自然语言指令,自主调用工具,甚至多个 Agent 协同完成一个复杂任务。这种范式和过去软件预设流程有本质不同。所以智能体开发有三个问题需要被核心关注:
1. 如何实现更精准地自主规划与执行
2. 如何实现多 Agent 协同的复杂任务处理
3. 如何构建更高效的工具调用机制
AI Agent对浏览器体验的重构
会议当天,腾讯还宣布了在智能体落地上的一个重要实践, QQ浏览器升级为AI浏览器,上线QBot,首批灰度4个Agent,其中包括AI高考通。
在腾讯的大模型落地版图中,浏览器是必要且必须拥抱AI Agent的场景。这已经在现有市场得到验证:前不久,由于Safari浏览器中的谷歌搜索次数出现首次下降,谷歌股价暴跌。Gartner曾预测,到2026年,传统搜索可能会下降25%。这意味着,传统浏览器如果不AI化,那么将被AI浏览器取代。
反过来看,Agent也并不是要冲击传统浏览器市场,如果结合得好,这可能是个双赢得选择。对于QQ浏览器也是如此,其迭代的一个核心思路是:Agent的加入不是重构浏览器,而是让浏览器的搜索体验可以更加高效,优先让Agent优化传统浏览器的痛点,是QQ浏览器在AI时代首要考虑的问题。
在此前的使用中,QQ浏览器的用户或许已明显感受到QQ浏览器提供的强大的工具功能,诸如PDF转Word等。这也是QQ浏览器此前很长一段时间的一个功能定位:工具串联。
Agent到来之后,QQ浏览器认为,基于之前丰富的网页工具,如果这些工具能被模型丝滑调用,无论是token消耗数量还是计算时间成本都会降低。因此QQ浏览器AI化目前的重要任务只有一个:如何让Agent丝滑调用“工具”。
“更侧重解决浏览器原始行为,通过大模型技术来提升浏览器基础功能的效率,而不是做特别泛或特别广的复杂性。“QQ浏览器QBot产品负责人刘汉博表示。
以“下载”这个每天都在使用的环节为例,浏览器用户经常遇到的问题是,下载源不靠谱、页面打不开或内容隐藏较深等。模型能否具备一定的反思和学习能力,能理解人类的真实需求,自动完成多步操作:用户只需发出一个指令,QQ浏览器便能迅速定位并下载最精确的内容。
“如果Agent具备了使用浏览器的能力,那它的‘行为边界’就大大拓展了,可以覆盖很多真实场景。这也是平台赋予开发者和客户‘想象空间’的关键。”吴运声表示。
未来,腾讯也在研发本地电脑的沙箱能力(Computer Use 插件),让Agent可以操作本地软件、编辑文档、调用工具,就像一个“虚拟操作员”。“你设想一下,如果一个Agent不仅能上网,还能帮你打开Excel自动填报表格、用Photoshop批量裁剪图片,那它在企业内部的价值就会非常大。”
大模型浪潮让企业更加需要知识库
智能体之外,腾讯的另一大重注赛道是知识库。一方面,结合了企业私域知识的智能体在思考、执行和决策上会更加精准;另一方面,比起智能体执行任务,“大模型+知识库辅助个人和企业提效”在短期来看更有确定性。
大模型的幻觉问题短期内难以解决,而企业级场景对准确性的要求又非常高,通过企业知识库让大模型“学习”专业领域的知识是一个解法。可以说,大模型让企业更加需要知识库。
综合腾讯内部的这一战略判断,在当天的大会上,腾讯乐享正式升级为乐享知识库,在知识整合沉淀、知识更新、权限管理、AI问答等层面为企业用户提供服务,提升知识流转效率,也进一步让企业能打造懂自身知识的AI助手。
据腾讯云副总裁、腾讯乐享业务负责人答治茜回忆,腾讯乐享业务起源于2008年前后有内部信息分享功能的km项目,2017年正式对外提供服务,大模型浪潮到来之后,腾讯内部决定将乐享定位为大模型时代具备知识管理功能的知识库。
“一个很明显的变化,还是技术上的变化。知识库产品的形态,完美和大模型的能力做了非常好地结合。它既用到了大模型本身的通用能力,同时又通过知识库的嫁接,完成了知识的沉淀、积累和进一步的精细化的提炼。所以,让大模型真正地走向生产环节,真正地走向应用,知识库是我们看起来,目前看到一个非常明确的场景。”答治茜表示。
他也补充,目前,企业使用Agent已经形成趋势,往后推几年,当企业内Agent遍地开花时,智能体的AI问答数据提取亟需一个统一的‘裁判’,而不是各说各话。基于此,腾讯认为,未来企业当中,Agent搭配知识库将会是一个核心需求场景。
为什么大模型技术能够为产品带来如此多改变?实际上,过去用传统 AI 技术实现上述能力时,抽取关键词、生成摘要这类任务,对语言理解能力要求很高,效果并不理想。对“2008年北京奥运会”这种长实体的识别非常依赖词典或规则,扩展性很差。但现在有了大模型,特别是多模态大模型,在语义理解、上下文建模、内容切分、标签生成等方面都有显著提升。
总结来讲,大模型在技术上的突破,让之前成为问题的问题被迎刃解决。而腾讯作为一家强产品基因的公司,在新技术打开想象力之后,让产品更好用成为本能。
用吴运声的一句话来说,比起智能体数量的增长,腾讯更关注的是:如何将大模型、智能体技术真正融入企业的业务流程,以满足企业的真实业务需求。“这不是一个简单的‘产品交付’,而是构建了一个高度可组合、可扩展的平台,企业可以在上面构建适配自己场景的复杂应用。”(本文首发WpBull.comAPP 作者 |秦聪慧)