MCP引领大模型革命:Agent+MCP重塑智能交互新纪元
在科技界持续热议Manus是否”套壳”的背景下,许多人忽视了Agent+MCP所蕴含的深远意义。Agent+MCP代表着自主探索、深度思考与工具调用,它正以接近人类的学习和工作方式,逐步完成现实世界中日益复杂的任务。当前MCP的兴起浪潮,恰似十几年前iPhone+iOS初现时的场景——那个改变移动通信生态的起点,鲜有人意识到移动互联网时代的巨浪即将席卷而来。根据个人判断,一旦MCP共识形成,大模型面向消费者的趋势将势不可挡地颠覆一切。
01 Manus的”封闭验证”之旅
在资本高度关注、全球范围内备受瞩目的领域,一个名不见经传的团队却打造出现象级产品,这极有可能击中了产品市场契合点(PMF),为所有仍在探索中的创新者开辟了新路径。Manus现象堪称创业史上最经典的”轻量级验证”案例。这家公司以自身为样本,为行业验证了潜在的超大规模市场需求,且目标直指传统搜索引擎的领域。究竟什么是Manus?它为何能迅速走红?关键在于它找到了让普通人最便捷使用大模型的方式。
“通用Agent”这一概念无论能否完全实现,其”通用性”程度如何,Manus都能通过一句话,让用户以自然语言的方式,让大模型从始至终完成某项任务。无需与模型进行繁琐的多轮交互,它能够自主理解需求并调用相应工具。就像真人一样,可以打开网页、访问本地文件、启动各类软件应用,搜索产品信息、公司资料、相关数据,然后自行整理、排版,最终生成报告。这种”端到端”的工作模式,正是普通人真正需要的AI产品!
然而,人们发现迅速出圈的Manus并未自研大模型,而更像是一个模型和工具的”包装器”,”套壳”的质疑并非毫无根据。Manus本质上是一个基座模型+接口协议+调用工具的自主工作流系统。它以Claude为基座模型,结合阿里云通义实验室研发的Qwen-finetunes微调工具,采用CodeAct作为调用工具的”接口协议”,但关键区别在于Manus还集成了29个精心筛选的大模型调用工具。按类别划分,这些工具包括:12个浏览器操作工具(支持AI代理与浏览器、网站交互)、5个Shell操作工具(作为用户与操作系统内核的接口)、5个文件操作工具(支持文件打开、读取、写入、创建等)、3个部署工具、2个消息交互工具、1个信息查询工具(info_search_web)和1个idle工具。
Manus的独特之处究竟在哪里?虽然调用工具并非首创,自主工作流也不是全新概念,但推理式LLM与自主调用工具的结合产生了质的飞跃。
02 Coze首测:MCP to BMCP的演进
MCP作为统一”工具”生态的共识正在全球范围内形成。不妨打个比方,如果MCP的工具生态如同初生的iOS平台,那么谷歌的A2A技术则像是在这个关键节点上推出的Android系统。MCP的起源据Anthropic发明MCP核心工程师介绍,是为了给自家优秀的大模型拓展更多功能,他们在Cloud Desktop和IDE之间反复复制粘贴时感到繁琐,于是提出了解决方案:为AI配备一台”云电脑”,将多个大模型调用的Function以及所需的外部功能、数据集成在这台”云电脑”环境中运行,以解决典型的”M X N”问题。
MCP运行涉及Host、Client和Server三个核心组件。Host作为”需求发起方”,可以是聊天工具或专业IDE;Client负责连接Host与Server,如Cursor;Server则是需要扩展的外部功能或上下文数据。一个简单的MCP运行过程是:Host发出需求指令,通过Client与Server沟通,最终实现功能并将结果返回给用户。
字节跳动Coze的Agent产品”扣子空间”于4月18日晚开启内测,团队为此准备了充足的算力资源,但几小时内服务器即被用户热情挤爆。超出预期的反响再次验证了用户一直在等待能解决实际工作问题的AI产品。Coze Space定位为”AI Agent协作办公平台”,通过AI驱动的代理和模块化工具优化工作流程,成为用户与AI Agent协作的理想场所。它支持从任务分析到执行和结果生成的全流程自动化,提供两种模式:探索模式适合快速执行简单任务(如生成会议记录),规划模式针对复杂任务(如市场调研、跨行业分析),AI会在关键步骤暂停与用户确认后再继续。平台集成了60多个MCP扩展,涵盖飞书多维表格、高德地图、图像工具和语音合成等,支持数据分析、地理规划、内容创作等应用场景。其低代码/无代码环境让非技术用户也能通过自然语言构建AI应用。
有了Manus的封闭产品、有限调用工具,以及Coze的半开放协作智能体工作流,未来将如何发展?2025年4月23日,纳米AI正式上线MCP技能商店,宣称建立起类似DeepSeek等基座大模型的”万能工具箱”。基于本地客户端而非云端Host,纳米AI拥有4亿月度访问用户,目前是唯一面向普通用户的MCP平台。
周鸿祎既不选择只有29个固定工具的Manus,也不选择只有60个MCP扩展的半开放协作智能体Coze。他一步到位,直指普通人使用的超级智能体:调用工具更多、更自由、高度开放的MCP to C模式。纳米AI不同于Manus和Coze主要面向开发者圈子的封闭产品体系,自建了MCP开放市场,其思路类似iOS App Store。纳米AI通过自研MCP工具,逐一审核引入高频使用、口碑良好的MCP应用并限时免费接入,同时扩容第三方MPC Server,建立起初步的MCP应用生态,让大模型可调用超过100个经过筛选的高质量MCP技能应用,用户可以亲手打造自己的超级智能体!
这些MCP在被LLM调用时,多个技能并行运行,能模拟人类在真实世界完成工作,任务的多样性和泛化性尤为突出。作为首批实测纳米AI超级智能体用户,笔者创建”生成网页”的个人智能体案例:输入相对规范的Prompt并选择MCP工具。本案例选择了MCP工具箱里的firecrawl(免key)、纳米生成网页、sequential thinking(免安装)。创建智能体后,让其在”特朗普关税影响”的深度报告生成和网页代码生成任务中运行。最终生成的网页效果显著,这是全网首个无需调试代码、无需MCP工具调用配置、无需付费连接第三方高质量MCP Server,只需会写Prompt和选择合适MCP工具即可生成个人专属智能体的平台。若用户不擅长Prompt编写或工具选择,可直接使用官方模板智能体,如同在App Store选择应用一样,一键下载、配置、使用。
按照纳米AI的设想,通过MCP集成大量生态伙伴,让大模型与MCP工具技能自由组合,超越Coze和Manus的能力上限。目前,纳米AI能自动分析用户需求并拆解为多个子任务,自主调用工具(如浏览器、代码编辑器等)执行任务,并输出完整结果报告(如网页、PPT、Word文档等)。纳米AI的独特之处在于可通过MCP读取本机数据库,自动调用集成本地浏览器,跨过登录墙调用应用执行多步操作,让大模型和智能体完成此前难以实现的复杂功能。这背后是360团队在搜索和浏览器技术上的深厚积累。
根据笔者与相关产品和研发团队的深入交流:一方面基于360团队在搜索领域的积累,自建了千亿级索引库和百亿级精品库;另一方面,加入了更多MCP协议的搜索工具,如Tavily Search、Exa Search、Github、Google Scholar、ArXiv、PubMed、雅虎财经等,涵盖学术、医学、科学论文、代码等高质专业数据来源,极大提升了大模型专业知识搜索的广度和深度。得益于纳米AI的开放式设计,接入的MCP Server持续增多,专业内容搜索能力将不断提升。纳米AI还专门打造了适应中国网络特色的AI爬虫。与通用爬虫不同,它基于360搜索的爬虫能力,专为AI设计,能理解复杂页面结构,包括信息流、视频、社交网站动态网页代码,让大模型可提取网页正文、图片、视频、音频等资源。客户端还集成了首个为AI定制的浏览器,该浏览器的大模型调用基于本地计算机运行,实现多社交网站深度搜索和理解,突破登录墙和内容围栏,帮助用户在多个平台获取信息、评论、图片和视频,最终检索出更全面、高效、精准的信息。
目前,纳米AI支持的MCP工具数量最多、客户端体量最大,是首个可自由调用和组合MCP工具、支持用户自建Agent的平台。纳米AI选择了MCP to C道路,建立本地客户端+MCP自由调用市场,打造类似App Store的开放生态。未来,开发者还可在纳米AI平台上架自己的MCP工具并获得终端用户付费收入,形成平台、开发者、用户的三方闭环,实现可持续商业模式。这完全就是iPhone+iOS的思路!周鸿祎在PC时代成名,虽错过移动时代,但在大模型时代决心抓住机遇。地火已无法压制,MCP to C如同火山已突出地壳,即将喷发。