近年来,随着企业信息化的逐步发展,大数据时代的强势逼近,越来越多的企业开启了数据治理的工作进程,企业中数据包括静态数据和交易数据两种,由于交易数据依附于静态数据存在,所以我们所说的数据治理通常指的是静态数据的治理。根据中国企业数据治理联盟的定义,静态数据指的是描述业务实体对象的多维度信息(包括主数据、元数据、静态私有数据等),也可以理解为360°描述业务实体对象的相对静态的数据档案信息。
数据治理工作包括:数据环境治理、数据质量治理。
图 数据治理工作内容
数据环境治理包括:实现数据标准化建模,成立数据管理组织,制定数据管理制度,搭建数据生产流程,规范数据质量、安全和交换服务标准等。
数据质量治理包括:历史数据质量治理、数据生产过程质量控制和数据生成后的日常监测、分析、处理。要实现以上三个层面的数据质量控制,通过人工或者传统的业务系统已经被充分证明是无法实现的,因此需要搭建专业的数据治理平台,以便于数据环境体系能够全面的实现系统化落地、执行。
那么,目前国内主流的数据治理平台有哪些呢?
目前国内市场主流的数据治理平台有主数据管理平台(MDM)、企业数据治理平台(EDG)、主数据治理平台(MDG)、编码管理系统等。在这方面,中翰软件自主研发了中翰企业数据治理平台,中翰数据保养平台以及中翰数据管控平台等等。从平台厂商地域分为国内和国外,从平台侧重数据范围分为主数据、编码数据和静态数据,从平台来源分为物资编码管理系统(大部分国内厂商)、客户主数据治理系统(主要是国外厂商)、PDM/PLM系统(部分国外和部分国内厂商)。
面对以上各种工具平台,我们该如何选择呢?
首先,我们根据数据治理的范围、程度划分数据治理层级如下图。
图 数据治理层级划分(螺母数据示例)
针对数据治理平台的选择,我们要从三个方面进行分析:
为什么进行数据治理?
数据治理想要达到什么目标(治理范围、程度)?
数据治理需要防范什么?
具体见下表格:
5
附:惨痛的教训:
随着越来越多的大型企业集团逐步实施了标准的主数据管理平台,但让人意外的是2015年初开始逐渐出现了不少的失败案例,按照中翰软件在行业内的经验,我们发现,究其原因有五:
1)业务系统的不断变化(新增或者变更)导致的主数据模型、管理制度、流程等的频繁变化,增加后期运维难度;
2)只管理共享信息已经无法满足越来越复杂的业务过程,需要全视角(多组织、多系统、多维度)维护、存储和查询数据的全面信息;
3)主数据管理平台实施后,普通业务人员直接参与数据标准化的日常管理,数据管理知识的缺失造成操作过程中的各种错误持续发生(如类别选错了);
4)数据标准化项目后,运维管理人员无法延续数据标准的制定思路,无法快速拓展、完善数据管理体系;
5)标准主数据管理平台实施后,数据质量问题再次出现,并且逐渐积累显现出来。(山东中翰软件有限公司)