AI数据价值:7.5万亿产业赋能中国经济新机遇

近期,美国对华数据访问的限制措施引发全球瞩目。5月18日,美国国立卫生研究院(NIH)正式宣布禁止中国访问人类基因组、疾病研究等关键数据库及相关数据。与此同时,美国SEER、TCGA、GTEx、GDC等多个公共数据库也相继对中国实施访问限制。这一系列举措与2024年2月美国政府发布的第14117号行政命令紧密相关,该命令明确限制中国等“受关注国家”获取美国公民的个人数据。NIH的禁令不仅凸显了全球数据流动的壁垒,更让中国科研机构和企业深刻体会到数据资源对科技创新的极端重要性。

当前,中国正积极应对这一挑战。国家数据局近期首次向地方数据管理部门印发《数字中国建设2025年行动方案》,提出到2025年底实现数字经济核心产业增加值占GDP比重超过10%的目标,并要求稳步推进数据要素市场建设,算力规模突破300EFLOPS。国家数据局同时强调,将持续加大财政投入,支持地方和行业建设基础性、公益性、长远性的数据基础设施项目,并利用超长期特别国债资金加快构建国家数据基础设施架构。面向”十五五”规划,中国将加速研制国家数据基础设施规划。

作为全球首个将数据纳入生产要素的国家,中国已初步形成门类齐全的数据产业链。数据显示,2024年中国年度数据生产总量达41.06泽字节,同比增长25%。截至目前,中国数据领域相关企业数量已超过19万家,数据产业规模突破2万亿元。按照20%以上的年均增长率测算,到2030年,中国数据产业规模有望达到7.5万亿元。

AI数据价值:7.5万亿产业赋能中国经济新机遇

5月17日举办的2025数据安全发展大会上,国家数据局党组书记、局长刘烈宏指出,中国数据资源丰富、产业体系完备、应用场景广阔,市场潜力巨大。他强调,必须维护数据安全,保护个人信息和商业秘密,同时促进数据高效流通使用,赋能实体经济。当前,中国正着力构建横向联通、纵向贯通、协调有力的数据基础设施体系,计划到2029年基本建成国家数据基础设施主体结构。

数据安全已成为AI技术发展的关键要素。安恒信息(688023.SH)CTO刘博表示,精确数据在垂直模型中应用至关重要,否则会产生”幻觉”。企业构建垂直领域AI智能体时,需要大量私有化数据进行训练。刘博强调,AI正为中国带来新一波发展机遇,推动业务软件开发、数字化转型和大数据应用,提升企业竞争力和创新能力。AI时代下,所有应用都值得重新审视,各行业将迎来新一轮产业升级。

在数字经济时代,数据已成为驱动AI突破与产业变革的核心动力。高质量数据集不仅是AI模型性能提升的基石,更重塑了从技术研发到商业落地的全产业链条。国家发展改革委价格监测中心副主任王建冬曾比喻:”数据就像工业血液石油,是企业生存发展的不可或缺生产资料。”近年来,中国数据要素市场发展迅速,但也面临统筹力度不足、市场发育不充分、跨境数据流通不畅等挑战。

AI数据价值:7.5万亿产业赋能中国经济新机遇

数据要素是指在商品或服务生产过程中投入的数据资源,主要包括根据特定需求收集、整理、加工形成的信息、数据集和数据产品。为保障数据要素规模化流动,AI产业链正加速构建大模型数据集,涵盖数据采集、清洗、标注、质量评估等核心环节。各环节需针对大模型数据集规模大、多样性强、行业垂直属性等特点进行技术研发和适配。

北京大学计算机教授黄铁军指出,文本类数据如文献、图书、论文等已广泛应用在大模型技术中,未来图像、视频等非文本数据将成为大模型学习的重要来源。因此,在关注数据安全保护的同时,更要重视数据价值挖掘,推动中国AI技术能力持续提升。

根据中国电子信息产业发展研究院发布的《高质量数据集发展报告》,2024年中国开发或应用AI的企业数量同比增长36%;全国地市级以上公共数据开放平台数量增长7.5%,开放数据量增长7.1%,高质量数据集数量同比增长27.4%。同时,去年利用AI大模型的数据技术企业数量增长57.21%,数据应用企业增长37.14%。报告显示,生态环保污染领域应用服务数据集较丰富;工业制造、生物医疗、农业、政务数据服务等行业数据集数量处于中等水平;能源光伏、金融法律、交通物流、教育、气象遥感等行业数据集数量相对较少,但各行业均在持续推进数据集构建和开放。

AI数据价值:7.5万亿产业赋能中国经济新机遇

赛迪研究院副院长刘文强透露,中国AI大模型参数已达几千亿级别,已推进全国7个数据标注基地建设,构建医疗、工业、教育等领域335个高质量数据集,标注总规模达1.7万亿TB,支撑了121个国产大模型的研发。中国数据标注产业产值已超过80亿元。刘文强指出,当前数据汇聚和共享方面存在数据存量小、产量低、数据集效果待提升等问题;数据供给和质量方面存在质量良莠不齐、缺乏主流高价值数据引领的现象;数据挖掘和利用方面存在算法偏见,加剧数据遗失,亟需建设高质量数据以挖掘数据要素价值。

随着AI时代到来,大数据变得至关重要。数据既要保护,又要被利用,如何通过AI数据产生真实价值,帮助企业降本增效,已成为国内从业者必须解答的课题。阿里云智能集团副总裁安筱鹏表示,自动驾驶领域的数据采集、清洗、标注、挖掘、流程训练、模型评测已从传统人工方式升级到基于AI大模型的自动化操作,使算法迭代时间从4个月缩短至7天,效率提升数倍。安筱鹏认为,AI大模型是数据要素释放价值的最短路径,通过在基础大模型上做行业数据训练,企业数据开发方式得到极大提升,应用构建流程简化效率提升70%,业务上线速度提升50%,数据分析周期缩短60%。

安筱鹏强调,数据服务的主体已从服务人转向服务AI。AI时代下,人机交互的底层逻辑发生巨大变化,企业需要重新定义人机交互体验、流量入口、客户需求、市场、流程和新的业务系统。对于AI大模型而言,数据规模将持续增长。统计显示,2023年中国数据产量约占全球23%,位居世界第一,预计2025年将达48.6ZB,约占全球1/3。同时,2025年全球数据交易规模有望增长至1445亿美元,到2030年将达3011亿美元(约合2.2万亿元)。

AI数据价值:7.5万亿产业赋能中国经济新机遇

中国科学院院士徐涛在《数据赋能生命健康产业》演讲中指出,生命健康大数据作为重要战略资源,具有复杂性和敏感性,需建立全周期安全体系。通过区块链加密、隐私计算等先进技术,可实现生物样本数据的合规流通,预计为药企降低30%研发成本。中国工程院院士沈昌祥则提出”可信计算3.0″解决方案,强调在数字经济时代需重构安全防线,我国自主研发的可信计算产品链已覆盖芯片、系统、应用全环节,通过构建主动免疫防护体系,能有效抵御新型网络攻击。

数据规模暴增,AI下半场是智能体。一位行业人士对WpBull.comAGI表示,DeepSeek让政务服务企业迎来新机遇,无需购买算力即可使用AI大模型。浙江省内多个场景已使用基于DeepSeek和私有化数据的专用模型,例如浙江省中医院已在妇产科、儿科、血液内科等多个科室试用AI医护助手。安恒信息董事长范渊表示,智能体与动态数据安全结合是必然趋势,很快将进入”智能体影响决策”环境,因为AI比人更懂数据、业务和行为。传统数据安全阶段仍存在诸多问题,而大规模、高通量、快速率的开放环境要求动态安全从静态保护转向动态保护,从边界安全到内生融合安全,由封闭环境保护转向开放环境。

范渊强调,AI下半场一定是智能体,智能体是大模型到场景应用的必然演进。AI智能体正从”条件自主”不断演进到”完全自主”,成为安全工作者的伙伴,具备自主学习、深度进化能力,能与安全工作者共同定义问题、参与复杂决策,甚至给出创造性方案,应对所有工作场景。刘博进一步补充,AI发展至今已不仅是”大模型”,而是需要混合智能体、MCP等技术和工具。大模型赋予用户思考和信息整合能力,但不能完全替代软件,需要通过智能体、MCP等方式为客户提供不同场景的调用工具,从而大幅提升企业工作效率。

AI数据价值:7.5万亿产业赋能中国经济新机遇

早在2023年,安恒信息推出”恒脑・安全垂域大模型”,并在多个场景成功应用。今年5月上旬,恒脑升级至3.0版本,成为国内首个安全AI智能体。依托恒脑,安恒信息已完成500多个共创智能体,覆盖数十个场景,并快速与现有产品进行能力集成。谈及具身智能安全,刘博表示,物理世界安全同样重要,需保证无人机、智能机器人等设备不被入侵,网络安全挑战更大,一旦入侵操控可能导致设备失控。因此,需要提供软件安全系统保护具身智能操作系统、嵌入式系统和自身软件的数据安全、网络安全。

2025数据安全发展大会上,温州市、重庆市等25家城市代表共同签署数据要素合作”百城行动”城市联盟,三十多家数据企业集中签约,共同建设数据要素产业新生态。落地数源安全合规检测中心、温州瓯越数安实验室等6个高能级平台和实验室。然而,当前中国仍面临数据存量小、产量低、数据集质量参差不齐、缺乏主流高价值数据引领、数据利用效率低等问题,需做好数据源头管控,确保数据来源可靠完整,加强数据隐私和安全保障,推动数据安全评估能力建设。

刘烈宏提出三点意见:一是持续推进数据基础制度改革创新,加强数据要素综合试验区建设;二是加快健全数据流通利用基础设施,依托可信数据空间等技术试点,探索可复制、易推广、能持续的运营模式;三是大力推进数据要素市场化价值化实践,将海量数据资源优势转化为经济发展新动能。国家数据局支持在浙江等10个地方开展数据要素综合试验区建设。刘烈宏此前在第八届数字中国建设峰会上强调,要抓住AI发展机遇,推动数据要素市场化配置改革和”人工智能+”行动同频共振,持续推进高质量数据供给,加快推动数据要素与AI、科技创新、产业发展和赋能应用相结合,推动行业高质量数据集建设,推动数据产业高质量发展,为AI技术创新和产业应用提供坚实的数据基础。(本文首发于WpBull.comApp,作者|林志佳)

文章网址:https://www.wpbull.com/ai/29660.html