AI编码崛起:2025年中级程序员或被取代
程序员创造的AI,最先替代的可能是程序员自身。阿里云云原生应用平台负责人、通义灵码负责人丁宇向光锥智能表示:“大模型的编码能力,现在已经具备高阶程序员(月薪几万元)的水平了。”实际上,AI代码工具并非新生事物,早在上一波人工智能浪潮中就已开始落地应用。但与过去相比,如今的AI代码产品已从单纯的辅助工具进化为能够执行复杂项目、进行长上下文本编辑、独立完成简单代码任务的工程级“协同”编码工具。商汤科技旗下AI代码产品小浣熊家族的技术负责人张涛对光锥智能指出:“从辅助到独立写代码,AI代码已经进化为一个工程级‘协同’编码工具。”
基于这一进化,越来越多的企业开始借助AI代码工具实现程序开发的降本增效。Meta创始人扎克伯格日前预测:“2025年,AI将达到中级软件工程师的编程水平。”Meta计划从2025年开始实现中级软件工程师工作自动化,最终将应用程序所有编程工作外包给AI。这一预测并非危言耸听,当前AI生成的代码在企业中的渗透率已达到惊人水平。例如,谷歌有超过25%的新代码由人工智能生成;科大讯飞内部AI生成代码采纳率从2023年10月的30%飙升至2024年6月的52%,单元测试行覆盖率也从30%提升至50%。
AI编码赛道之所以成为大模型应用最火热的赛道之一,是因为“AI Coding(人工智能编程)是大模型应用落地中最高频刚需、最具确定性的场景,是经过PMF(产品市场匹配度)验证的领域。”丁宇对光锥智能解释道。正因如此,微软、谷歌、AWS、阿里、百度等领先科技公司纷纷布局AI编码赛道。然而,众多同类型产品的涌现也导致了同质化竞争,未来如何成功突围?如何实现真正的大规模商业化落地?从打辅助到协同作战,AI正逐渐成为程序员的专业同事。
2024年8月,美国知名企业Cloudflare副总裁Ricky Robinett年仅8岁的女儿,仅用45分钟就开发出一款聊天机器人,引发180万网友在线关注。她使用的AI代码编辑器Cursor也一夜爆火,再次将AI编码赛道推上行业关注焦点。据PitchBook数据显示,全球范围内已有约250家初创公司推出AI编码助手。在国内,阿里巴巴、百度、腾讯、字节跳动等互联网大厂,科大讯飞、商汤科技等独角兽企业,以及AI大模型创业公司智谱AI等都纷纷推出相关产品。AI代码产品如雨后春笋般涌现,背后是大模型赋予AI代码工具能力的实质性进化。
早期AI代码工具主要执行简单任务,如根据程序员注释自动补全代码,提供代码错误提示等。随着大模型能力升级,AI代码工具能解决的问题越来越多,例如基于存量工程进行维护升级工作,“已经能够自主实现某些研发任务了。”丁宇表示。大语言模型能以自然语言理解人类指令,根据工程上下文自动完成复杂编码任务,包括同时修改前后端多个文件、执行脚本、编写测试、部署代码等。
“最开始通义灵码是以编码助手形态出现,主要给程序员打辅助,根据代码上下文自动补全代码。”丁宇介绍道,“2024年年底通义灵码升级到2.0的AI程序员形态,成为协同编码助手,能和人类程序员协同工作,感知整个工程,根据场景任务做批量文件修改,实现能力的跃迁。”从AI代码工具助手升级为AI程序员,前者代码生成主力仍是人,后者则逐渐转向以AI为主,人类主要起监测和确认作用。“此前主要是由人写代码,AI辅助做一些简单、可预测性强、重复性的工作,而现在则可以通过需求描述,让AI理解和帮助程序员完成一些中等难度的代码开发工作。”张涛指出。
随着多模态大模型、深度推理大模型的进化,AI代码工具的能力也在不断完善。商汤小浣熊家族的“办公小浣熊”产品,除了进行基于大模型的数据处理、数据分析和文档创作外,还能生成数据图片和PPT文件,是多模态能力输出的综合体现。多模态输入同样重要,“很多工具类产品,如果仅通过语言描述交互,很难准确实现需求,因为文本描述存在信息损失。同时,大模型当前自身存在的语义理解能力欠缺,幻觉问题等,也限制了AI代码工具的能力边界。直接以图像或视频等视觉方式输入至大模型,则能更高效完成任务。”张涛强调。多模态大模型还能实现从文生图到生代码的端到端全栈功能。以网站设计为例,设计师可通过文生图设计前端视觉稿,再交给Coding大模型翻译成前端界面,大模型自动生成后端代码。
目前,AI编码已能完成复杂任务,消除知识技能的不对称。从前端到后端可一体化生成,打破了前端、后端人员能力的分离协作模式,大幅提效。生成后,AI编码还能帮助程序员自动生成测试,并返回测试修改结果。“不过,虽能自主生成部分代码,但实际过程中AI生成的代码并不能一次性运行起来,存在诸多bug。”浙江大学AI方向在读博士生陈荣(化名)对光锥智能表示,“复杂代码基本很难一遍过,从技术逻辑上可理解为模型把coding当作翻译任务,输出代码序列,可能没考虑好运行环境等。”
这背后原因主要有两方面:一是人类很难准确描述实际需求,即使资深程序员也需要反复修改;二是大模型当前自身理解语义能力欠缺,包括幻觉问题,也限制了AI代码工具的能力边界。“在模型上下文窗口允许范围,大模型可达到万行级代码的理解,但AI代码的能力边界仍然较难界定。”张涛指出。就像人类程序员需要反复修改测试代码一样,在AI生成代码过程中,也可通过多轮交互减少bug。丁宇表示:“AI编码不是一次性生成最终结果,而是与多轮交互迭代完成,在联合编码过程中有持续思考和推理探索,多轮交互修改结果正确后,还能自主进行测试验证,并对代码进行部署使用,全生命周期完成任务。”
尽管当前AI代码工具产品仍存在问题,但越来越多的企业开始引入。这类工具不仅提高了程序员编程效率,也实现了企业降本增效。“便宜活儿好”的AI代码工具让更多无代码能力的人接触编程,并自主开发产品功能。目前,AI能独立实现自主编程的场景主要有三类:小产品(如个人生活类APP助手)、以内容为主的网站(代码量和难度适中)、办公产品(如Excel表格编辑、数据汇总)。这些场景整体代码量不高,开发难度不大,对开发者编程知识要求也不高。
尽管AI代码工具降低了编程门槛,却需要程序员提升自身编程能力上限。尤其在复杂软件开发及大型企业级系统软件开发中。一位金融科技行业程序员肖肖(化名)对光锥智能表示:“公司工程化项目很难直接全盘交给AI,工程化项目流程多,需要多部门协作,AI无法看到全局。”可见,在企业中,大模型更多地是做脏活累活,全局性及创新性工作仍需人类程序员完成。“程序员的工作并不仅仅只是生成小型项目,其面对的生产代码,整个项目文件上下文非常复杂,代码关系也很繁杂,程序员对代码质量也有自己的要求。”张涛指出。这意味着,在企业中,AI代码工具更多是辅助性角色,但也间接拉高了程序员工作能力的下限,毕竟简单重复性工作AI已能搞定。“让AI直接生成一家银行所有业务的10万个代码文件,它目前肯定是做不到的。”丁宇坦言,“在企业大型项目中,AI编码肯定是从小任务开始,找到一个切面,如实现一个功能模块,或在一个百万工程代码中找安全漏洞,AI能做得非常准确且快速。”
另外,大型企业项目最怕系统的不确定性,若出现系统bug,可能带来巨额资源和经济损失。因此,丁宇认为:“大型工程仍需要人类程序员掌握软件开发过程中的不确定性,如架构设计、领域建模等,把已确定的内容拆解开来,如模块开发、找安全漏洞、补充测试用例等,并交付给AI,让其根据人类指令做这些确定性工作。”尽管只是打辅助,AI代码工具却给开发者和企业带来了实打实的效率提升。以阿里云为例,目前所有技术全员都在使用通义灵码,月活占比超82%,每天AI生成的代码占总提交代码量30%以上。基于此数据可算出,AI对开发者提升效率约17.5%,打个折扣也在10%-15%之间。“因此,我每次见企业负责人都会讲通义灵码能给工程师团队提效10%以上。”丁宇表示,“也就是说,如果一家企业有100个工程师在使用通义灵码,就能额外产出10个工程师的产能。”
此外,人类程序员分类细致(如前端、后端等),若让后端做前端,可能需要大量培训。但有了AI代码工具,程序员只需问问AI,就能轻松学习各种语言平台的研发知识,快速上手。“以前做一个项目可能花两三周预研,现在两三天就能完成任务,让员工实现1-N的能力增长。”丁宇说道。当然,AI还能帮助程序员做更多重复性工作,如测试代码编写。很多开发者都不愿写测试代码,这类工作在程序员看来没有创造性,却不得不做。AI代码工具可根据程序员代码作为提示词,自动生成单元测试,真正解放开发者,让开发者专注更具创造性的工作。
对于企业而言,除显性价值提升外,AI代码工具还存在隐性价值。它能帮助企业更容易保持软件系统的高质量且长期稳定,不仅可做单元测试补全,还能自主发现安全漏洞并给出修复建议,提升质量的同时缩短项目交付周期。更有趣的是,现阶段AI编码能力借助外部工具使用,已逐渐赶超中级程序员。商汤小浣熊底层模型特点之一,就是在代码解释器能力上做了加强,让模型能实现自主代码调试迭代。“在复杂项目中,单纯依靠大模型推理生成代码,一次性通过率不高,一般不超过20%。”张涛指出,“而办公小浣熊基于代码解释器方案,在日常图表等能力上,代码通过率已接近80%。”
AI编码赛道已是一个通过PMF验证的落地方向,这也导致众多玩家切入,出现同质化类型的产品。目前,中国市场中众多企业,包括互联网大厂、中小企业及大模型创业公司,都推出了AI代码产品,如阿里云的通义灵码、百度的文心快码、字节跳动的豆包MarsCode、腾讯云AI代码助手、智谱AI的CodeGeeX等。尽管AI代码产品众多,但各家提供的功能能力差别不大,“目前市场中同质化比较严重,功能实际上差不多,毕竟编程产品希望能解决用户的问题是相同的。”张涛指出。
不过,随着大模型技术迭代升级,AI编码赛道已迈入“分化”的中期阶段。“从当前AI代码赛道来讲,已经开始分化出不同的实现方式。”张涛表示。像Cursor这样的产品,能基于自己改造的开源IDE做完整任务编程;也有像Bolt.new这样的产品,以线上工具形式使用,用户描述需求,AI完成网页开发,但它只能实现前端技术栈相关内容等。现阶段可见,各产品已找到不同细分场景并构建产品优势,实现差异化发展——有的擅长网页开发,有的擅长已有项目代码修改,有的可做小工具开发或低代码工作等。丁宇也认为:“软件研发存在非常多场景,有很多细分领域,企业可以从不同切入点切入,做细分场景创新或产品形态创新。”
各家AI代码工具产品在功能场景上的细分,也会给产品带来商业差异,不同企业的商业化侧重点也不同。例如商汤科技小浣熊家族中办公小浣熊产品主要聚焦办公工具类赛道,商业化落地中C端和B端同步进行。C端主要以付费订阅为主,B端以企业私有化部署为主,“目前私有化部署客户接近40家,包含体量较大的互联网厂商等。”不过,张涛同样看好C端赛道的市场潜力,现阶段C端产品推广超预期。
从场景功能到商业化落地方向,AI编码赛道都已开始出现分化,但这并非AI代码行业发展的终局形态。随着大模型技术能力持续迭代,下一步AI代码将实现“自主编程”,即不仅辅助程序员开发项目,而是能自主接受独立需求,完成完整项目任务。“未来一定会走向AI自主编程,这也意味着将为企业和开发者带来10倍的IT生产力提升。”丁宇说道。