
2018年3月,我国首个数据管理领域的国家标准《数据管理能力成熟度评估模型》(GB/T 36073-2018,简称DCMM)正式发布,并同步开展贯标和推广工作。这一标准的出台,为企业数据管理提供了多维度的框架,从根本上改变了企业对数据管理的认知和实践方式。但与此同时,企业在借助DCMM推动高质量数据集建设的过程中,也面临着标准落地差异、数据安全与开放矛盾、技术支撑不足以及人才缺口等诸多问题。基于此,深入探究DCMM 推动企业高质量数据集建设的现状、问题,并提出针对性建议,对于进一步发挥DCMM的赋能作用,助力企业在数字化时代实现高质量发展具有重要意义。
文/李玮
围绕DCMM(《数据管理能力成熟度评估模型》)对企业高质量数据集建设的推动作用展开研究。首先阐述了DCMM 推动企业高质量数据集建设的现状和成绩,包括促使企业提高对数据管理的认知,使其认识到数据管理是系统性工程,建立“数据资产”意识;通过规范数据全生命周期管理流程提升数据质量,为高质量数据集建设奠定基础;推动企业开放和服务数据,让高质量数据集在应用中创造价值。
接着分析了这一过程中面临的问题,如不同企业对DCMM 标准的理解和执行存在差异,数据安全与开放之间的矛盾突出,技术支撑能力不足以及复合型人才缺口明显等。
最后,针对这些问题提出了相应的建议,包括借DCMM 修订契机增加对高质量数据集的要求,企业协同推进DCMM 贯标和高质量数据集建设工作,以及地区和行业协同开展相关工作等,旨在为DCMM 更好地赋能企业高质量数据集建设提供参考。
一、DCMM推动企业高质量数据集建设的现状和成绩
(一)DCMM推动企业提高对数据管理的认知,为高质量数据集建设提供前提
在数字化转型浪潮下,国家发布《促进大数据发展行动纲要》《大数据产业发展规划(2016-2020年)》等政策文件以来,数据作为核心生产要素的价值日益凸显。但是,许多企业对数据管理缺乏系统认知,将其视为技术部门的辅助工作,当作信息化建设工作的一部分。
2018年3月,《数据管理能力成熟度评估模型》(GB/T 36073-2018),我国首个数据管理领域正式发布的国家标准发布以来,同步开展数据管理能力成熟度评估和推广,从根本上改变了这一局面。DCMM以成熟度评估模型为框架,清晰界定了数据管理的战略、组织、制度、流程等多维度内容,让企业逐步认识到数据管理是覆盖全业务流程、涉及多部门协同的系统性工程,推动企业开展数据管理人员、体系和平台建设。
截止到2025年7月,已经有7768家企业通过贯标。通过DCMM贯标,企业逐步建立起“数据资产”意识。A企业在引入DCMM前,数据分散在生产、销售、研发等多个系统中,部门间数据壁垒严重,管理层对数据价值的认知停留在“记录信息”层面。经过DCMM贯标、评估与整改,企业成立了专门的数据管理委员会,高层牵头制定数据战略,将数据管理纳入企业发展规划。员工也通过DCMM培训了解到数据质量对生产效率、产品质量的直接影响,主动参与数据标准化工作。DCMM贯标为企业提供了高质量数据集提供了组织保障和技术基础,使数据管理从被动执行转向主动规划。
(二)DCMM推动企业提升数据质量,直接促进企业高质量数据集建设
数据质量是高质量数据集的核心,而DCMM通过规范数据全生命周期管理流程,为企业提升数据质量提供了可操作的路径。DCMM中有数据质量能力的评估要求占到整个评估内容的1/8,要求企业从数据采集、存储、处理到应用的每个环节建立质量管控标准,明确数据质量责任主体,形成“源头防控、过程监控、问题追溯”的闭环管理机制。
B企业在DCMM贯标过程中,针对客户信息数据集存在的重复录入、字段缺失、格式混乱等问题,按照DCMM数据质量域要求,重构了数据采集流程,开发了自动化校验工具,对关键字段设置校验规则,实时拦截错误数据。同时,建立数据质量评分体系,定期发布数据质量报告,推动业务部门与技术部门协同整改。经过DCMM贯标,B企业客户信息数据集的准确率从78%提升至96%,完整性从65%提升至92%,为精准风控、个性化服务提供了可靠的数据支撑。DCMM通过标准化的数据质量管理,直接推动了企业高质量数据集的落地。
(三)DCMM推动企业开放数据和服务,为高质量数据集的应用赋能
高质量数据集的价值不仅在于存储,更在于使用。DCMM强调数据的开放共享与服务化,引导企业打破内部数据孤岛,建立数据服务体系,让数据在流通中创造价值。通过DCMM评估,企业逐步构建起数据开放目录、数据API等共享机制,使数据集能够高效支撑业务创新与决策。
C企业借助DCMM贯标,整合了用户行为、商品库存、物流信息等多源数据集,建立了统一的数据服务平台。业务部门通过平台快速获取所需数据,开发出智能推荐系统,根据用户浏览历史和消费偏好精准推送商品,使转化率提升30%;供应链部门利用库存与物流数据优化配送路线,降低物流成本15%。同时,部分企业在DCMM指引下,探索数据对外服务模式,如将脱敏后的行业数据共享给合作伙伴,共同开发创新产品,形成数据价值共创生态。可以说,DCMM推动的数据开放与服务化,让高质量数据集真正成为企业发展的“助推器”。
二、DCMM推动企业高质量数据集建设面临的问题
企业依据DCMM贯标建设高质量数据集的过程中,面临着多重挑战:一是标准落地存在差异,不同行业、规模的企业对DCMM的理解和执行深度不一,部分中小企业因资源有限,仅满足基础评估要求,难以依据高等级要求深入推进高质量数据集建设;二是数据安全与开放矛盾突出。DCMM贯标鼓励数据开放,但企业在高质量数据集共享过程中,对隐私保护、数据泄露风险的担忧加剧,导致开放范围受限;三是技术支撑能力不足,构建高质量数据集需要数据治理工具、算力、人力等支撑,部分企业技术投入不足,难以满足DCMM对数据处理、分析的高阶要求;四是人才缺口明显,既懂DCMM标准又精通数据管理的复合型人才稀缺,导致企业在数据集建设中缺乏专业指导,影响推进效率。
三、DCMM推动企业高质量数据集建设的建议
(一)借DCMM修订契机,增加对高质量数据集的要求
DCMM自实施以来,已经过去7年时间,数据管理行业技术飞速迭代,多模态、大模型、数据编制等技术不断演进。DCMM标准修订恰逢其时,DCMM应结合行业实践动态优化,在修订中增加对高质量数据集的具体要求。一是细化数据集的质量指标,明确高质量数据集建设要求、分级分类和评估标准等,细化不同成熟度等级对应的数据集建设标准。二是以DCMM标准为基础,制定高质量数据集建设系列标准,形成“标准集群”,增加数据血缘、数据溯源等技术标准要求,确保数据集的可追溯性。三是将数据集的建设和应用能力纳入DCMM贯标体系,进一步推动企业从建数据集向用数据集转型,推动高质量数据集用于人工智能模型开发训练,提升模型性能。四是针对具身智能、人形机器人、低空经济等新兴领域,细化DCMM贯标要求,使DCMM更贴合企业实际需求,为高质量数据集建设提供更精准的指引。
(二)企业协同推进DCMM贯标和高质量数据集建设工作
企业应积极推动DCMM贯标与高质量数据集建设的深度融合,通过整合数据管理资源和优化业务流程,制定出协同推进方案,以实现数据治理能力的全面提升和业务价值最大化。一是以DCMM为框架,在公司战略中明确数据集建设目标和路径,将数据集建设指标纳入绩效考核,形成全员参与的责任体系。二是借助DCMM贯标过程中的诊断结果和评估报告,针对性地补齐数据集短板,针对数据孤岛等问题,同步推进数据整合与共享机制建设。三是引入专业的第三方服务机构,结合DCMM贯标与数据集建设需求,提供定制化解决方案,降低实施难度,确保贯标和建设工作相互促进、高效落地。
(三)地区和行业协同开展DCMM贯标与高质量数据集建设
选择国家人工智能创新应用先导区、数字产业集群、中小企业特色产业集群等基础较好的地区和金融、能源和运营商等行业开展试点,形成示范效应。一是推动相关地区出台政策,构建跨行业的产学研用平台,对开展DCMM贯标和高质量数据集建设的企业给予优惠政策;二是行业协会结合DCMM标准牵头制定本领域高质量数据集建设指南,明确行业特色要求。三是通过试点示范等工作总结可复制的经验,如跨企业数据共享模式、数据集质量管控最佳实践等,发布DCMM贯标与高质量数据集建设典型案例,逐步向全国推广,推动DCMM与高质量数据集建设在更大范围形成合力。
(作者单位:国家工业信息安全发展研究中心)
审核:刘 坤
责编:王世明
编辑:刘 彬