您现在的位置是:首页 > 置顶轮播图822*450 >
破数据堵点 强工业根基
2026-04-24 10:11:06作者:路沙来源:中国信息化周报
摘要 工业数据筑基,本质是一场数据资源的系统性 “垦荒”。它直面工业数据 “采不到、集不全、用不好” 的痛点,以标准统一、可信流通、高质量供给为核心,推动政企研协同、产业链联动。...

筑牢智能制造数据根基
作为拥有全球最完整、规模最大的工业体系和完善的配套能力的国家,我国工业数据资源开发利用水平却与此地位不符,世界银行数据显示,我国工业数据利用率不足45%,远低于德国、美国65%~75%的水平。“数据海量、价值薄弱”的矛盾突出,成为制约我国制造业高端化、智能化、绿色化升级的关键短板。
这表明,尽管数据日益成为我国工业的重要生产要素和战略资源,但仍长期存在采集难、汇聚难、应用难的核心堵点。为此,工业和信息化部于日前印发《关于启动工业数据筑基行动开展面向人工智能赋能的高质量行业数据集建设先行先试的通知》(以下简称《通知》),旨在加快推进数据的高效采集、大规模汇聚以及深层次应用。
《通知》提出,到2026年底,培育一批行业数据合作联合体,建设重点行业数据可信互联平台,汇聚一批行业数据资源,攻关一批数据关键技术,研制一批工业数据标准,打造一批高质量、标准化、可流通的行业数据集,赋能一批行业大模型、工业智能体等应用落地。
工业和信息化部相关负责人表示,工业数据筑基行动的显著特点是面向人工智能赋能制造业。同时,通过开展高质量行业数据集建设的先行先试,着力突破工业数据采、集、用三个方面的瓶颈。
“从行业属性来看,工业数据具备多源异构、强时序性、高维度、强专业性等典型特征,其贯穿需求、设计、生产、物流、售后等全流程,是驱动智能制造、实现产业提质增效的关键生产要素。工业数据筑基行动通过关键场景的‘小切口’先行先试,不仅能实现工业数据‘采’‘集’‘用’一体化发展,让数据在设备中流动,还能促进‘大模型+小模型’的融合协同,赋能行业降本增效、产品升级。”北京交通大学教授,博士生导师朱明皓如此说道。
用友网络助理总裁孙汉明在接受《中国信息化周报》记者采访时表示,工业数据筑基行动是一个体系化工程,相较以往分散式数据采集与管理,更聚焦数据标准化、深化应用及AI模型落地。同时,该行动不仅目标明确,实施路径也较为清晰,就是以工业互联网平台为基础,建设数据资源库,联合行业企业、协会开展技术攻关、制定技术标准,推进重点领域高质量数据集建设。
以联合体形式破解数据共享难题
在实施主体方面,《通知》明确,聚焦数字化转型基础好、数据价值挖掘潜力大的制造业重点行业,依托重点行业企业、平台机构、先进制造业集群、中小企业数字化转型城市试点四类主体,推动成立一批联合体开展先行先试。
关于联合体建设,朱明皓在接受《中国信息化周报》记者采访时表示,目前来看,制造业企业在生产过程中产生且存储了大量数据,但不具备挖掘数据的能力,而数据服务商对模型、算法具有较高的理解能力,但是受限于企业数据隐私安全,无法获取数据,从而导致数据不能自由流动,难以创造价值,通过联合体的方式,双方共同探索价值共享机制,对于解决数据“不愿、不敢、不会”的难题具有较高的意义。
“在联合体数据开发过程中,首先要满足制造业企业数据安全要求,可以运用区块链技术保障企业关键数据隐私,其次要建立合理的利益分配机制,联合体通过数据开发形成的成果,制造业企业具有优先使用权,保障数据供给者的利益。”朱明皓如是说。
孙汉明表示,打造行业联合体,应采用“平台+龙头+集群+行业试点”协同模式,推动软硬一体化方案落地,构建生态合作体系,降低中小企业参与门槛,从全产业链视角推进数据筑基。在这一过程中,对于用友来讲,需要依托用友BIP平台整合数据,联合龙头企业打造行业核心数据底座,盘活企业沉睡数据资产,以AI技术释放数据价值,推动企业开放共享数据。“不仅如此,还需借助区块链等技术实现数据‘可用不可见、可控可追溯’,同时配套AI数据确权、估值与收益分配机制,保障数据共享安全。”孙汉明说。
对此,盘古智库高级研究员吴琦表示,破解“不愿、不敢、不会”共享数据的难题,关键是把联合体做成“利益共享、风险可控、能力可用”的组织。一要由龙头企业、平台机构、科研院所和数据服务商共建规则,明确数据分类分级、权责边界和准入退出机制;二要依托行业数据可信互联平台,实现可授权、可追溯、可审计,降低泄密和合规风险;三要建立数据确权、价值评估、收益分配和交易机制,让共享有回报;四要配套标准、标注、治理和工具服务,让中小企业也有能力共享、敢于共享、真正共享。
加快高质量数据集落地应用
在重点任务方面,《通知》提到,依托联合体建设重点行业数据可信互联平台,打造行业数据资源库、数据技术攻关库、工业数据标准库、高质量行业数据集库等四大资源库。
朱明皓表示,工业领域数据普遍存在不平衡现象:一方面,企业采集数据量可以达到PB级,存储成本高,而且大部分数据属于正常重复样本,价值不高;另一方面,真正有应用价值的故障样本或者是工况变化数据较少。数据不平衡对于模型和算法应用存在较大难题。此次行动提出了要建立工业数据标准库和高质量行业数据集库,有利于指导企业进行数据治理工作,加快高质量数据的开发利用,形成可推广的行业模式。
“除了工业数据存在不平衡问题之外,大多数企业对数据的应用价值仍然不够清晰。同时,由于数据格式不统一、缺少规范等问题,也使得互联互通难度大。此次行动提出了系统梳理数据领域先行标准,加快数据标准研制等工作,有利于统一数据规范,形成‘采’‘集’的标准体系,这是建设高质量数据集的重要基础。”朱明皓进一步说道。
对此,孙汉明同样表示,工业大数据并不等于高质量数据,当前工业数据存在多源异构、协议不统一、通用性弱等问题,需搭建可信数据平台,通过统一工业协议标准、低代码连接器打通异构系统,结合龙头企业沉淀的行业标准完成数据清洗与标准化。
“高质量数据是AI算法精度的核心支撑,工业数据涵盖实时数据、研产供销服业务数据、图像视频数据等。当前大量视觉传感器数据仅用于监控回溯,未充分应用。为解决这一问题,数据筑基应该以场景为切入点,聚焦社会化高质量数据建设,例如冶金行业废钢智能判级场景,依托千万级高质量废钢图片数据实现价值落地,社会化数据可实现行业级价值倍增。同时,以价值为核心,通过云端SaaS产品、云平台实现数据价值普惠,形成数据归集—价值释放—标准确立的良性飞轮效应,而非盲目采集全量数据。”用友网络废钢智能事业部总经理赵东伟如是说。
推动大模型与工业场景深度融合
《通知》提到,要围绕研发设计、中试验证、生产制造等关键环节,开展行业大模型应用、工业智能体研发等场景落地。
对此,朱明皓表示,人工智能大模型的三个重要组成要素就是算法、算力与数据。工业数据筑基行动为人工智能赋能制造业奠定了高质量数据基础,通过数据与算法的有机结合在物理实体上闭环应用推动工业智能体实现生产过程的自感知、自决策、自执行与自优化,是迈向智能制造的关键技术路径。
可以看出,工业数据筑基行动通过统筹建设高质量行业数据集、完善工业数据标准体系、搭建数据可信流通与训练服务平台,直接为工业大模型提供了规模化、高质量、场景化的训练与微调数据支撑。其核心路径是以行业数据集建设先行先试联合体为抓手,联动链主企业、科研机构与人工智能企业,围绕研发设计、生产制造、运维服务、安全管控等典型场景,推动工业大模型快速适配行业需求、实现轻量化落地,并支撑工业智能体在真实工业环境中完成感知、决策、执行闭环验证,最终以数据筑基带动模型迭代与智能应用规模化落地。
“工业数据筑基行动落地模式为‘平台+龙头+生态共建’。以用友为例,基于用友BIP平台预制废钢判定、配料等细分行业模型,联合协会与专家完成行业微调,快速为中小企业部署,大幅降低实施周期与成本,是制造业数据要素化、AI产业化的关键一步。”孙汉明说道。
(本文不涉密)
责任编辑:路沙
上一篇:聚力AI+ 各地两会铸共识
下一篇:两会:人工智能+进入经济主战场





