
泛工业的数据治理常常从主数据入手,而金融业却鲜有专门建设独立主数据系统的。金融业不需要管理主数据吗?还是制造业的主数据管理多此一举?
金融业务的核心业务对象:客户,金融机构对客户主数据的管理必不可少。但金融业有专门的ECIF(客户信息管理系统),所有其他业务系统都引用ECIF的客户编码,不存在客户编码不一致的问题。甚至像微众银行的架构设计就是以客户为事实表设计的分布式架构。所谓无招胜有招,在原生业务系统架构就已经统一。
而泛工业生产链条更长,跨越业务系统更多,如果前期缺乏统一规划,不一致的问题就会暴露出严重的数据质量问题。
我在20年前有幸主导开发了中石油的MDM主数据管理系统。但近几年看到越来越多的泛工业企业在主数据的管理上出现明显的变化,有越做越“轻”的趋势。让我们跳出来看看主数据管理到底是什么。主数据管理的发展趋势是什么。
2007年Jill Dyche, Evan Levy提出的主数据管理成熟模型,大体可以把主数据管理可以分为五个层次,从低到高反映了主数据管理(MDM)的不同成熟度。
Level 0:没有实施任何主数据管理
Level 1:提供列表
就是手工的方式维护一个逻辑或物理的列表。当各个异构的系统和用户需要某些数据的时候,可以索取该列表。对于这个列表的维护,包括数据添加、删除、更新以及冲突处理,都是由各个部门的工作人员通过一系列的线下讨论和会议进行处理的。当业务规则发生改变或者出现类似的情况时,这样高度手工管理的流程容易发生错误。由于列表管理是通过手工管理的,其列表维护的质量取决于谁参加了变更管理流程,一旦某人缺席,将会影响列表的维护。
Level 2:同等访问
通过系统接口的方式,各个系统与主数据主机之间直接互联。在系统间实现主数据接口的标准化。这个模式的问题在于系统间会形成网状结构。主数据主机上存储的数据还是按照各个系统分开存储的,没有真正的整合在一起。
Level 3:集中总线处理
独立的MDM主数据管理系统, 将主数据集中存储在中央位置。支持一致性的企业级主数据。
Level 4:业务规则支持
通过工作流整合业务规则,确保主数据创建、更新是经过严格的审批。例如:供应商的创建需要各部门审批后才可以作为主数据在各系统中引用。通过工作流整合业务规则以便对共同数据的跨职能、异构规则进行更好的支持。
Level 5:企业数据集中
主数据和应用数据之间没有明显的分隔,是一体的。当主数据记录被修改后,所有应用引用的相关数据元素都将被更新。这意味着所有的消费应用和源系统访问的是相同的数据实例。MDM Level 5提供一个集成的,同步的架构,当一个有权限的系统更新一个数据值时,公司内所有的系统将反映这个变更。
大家常说的传统MDM主数据管理系统,是指Level 3、Level 4. 事实上,传统单独MDM系统已经是15年前的方式。随着越来越多企业构建数据底座,在数据底座中开辟一个主数据区域是更为先进的方式来解决数据不一致的问题。
所以金融行业没有专门的主数据管理系统是由于重视架构规划,每个核心业务对象都有明确的设计,来保证数据的一致性。
主数据核心是解决业务系统间数据不一致的问题。常见于信息化早期数据不规范的情况,存在一物多码的情况,数据割裂导致生产流程及数据分析流程无法贯穿。数据不一致是阶段性问题,随着系统改造逐步规范,逐步解决系统间数据不一致问题。主数据主要涉及企业经营的关键数据,如:客户、产品、供应商、组织机构、物料等。
例如下图是个交易数据集,里面中存在大量数据不一致的风险。第一列客户,只依赖客户的名字,重名和错别字都会产生严重的数据质量问题。同样,产品、地址也是类似问题。所以我们需要将这类数据拎出来,单独管理。
一些企业考虑以主数据作为数据治理的第一步,主要原因:数据不一致是显性数据质量问题,价值输出显而易见。但项目启动后发现困难重重, 主要原因如下:
请将以上相关问题的可行性都考虑清楚再启动主数据建设项目。
主数据设计:
主数据对象、属性的设计。最核心的部分,简单讲就是主数据的数据模型设计。下图是一个主数据对象的设计,就是设计实体和字段。
主数据标准管理:
主数据的数据模型设计完成后,就是将里面的行级数据统一口径。标准规范的主数据模型同时也定义了主数据标准的具体内容。主数据标准除了主数据模型中基础数据标准外(如产品名称、客户名称等),其中有很重要的一部分是参考数据标准,在一些场合上我们 也经常叫码表。实际上这块不只是关于主数据的参考数据,所有的参考数据都应在数据资产管理平台中进行统一管理。
这里面特别需要注意的是概念混淆 , 国内主数据领域常常将这里指的参考数据称为“主数据标准”。这个主数据标准与DAMA DMBOK的数据标准是完全不同的概念。数据标准指不仅包括参考数据的标准,也包括基础数据标准和指标数据标准。数据标准在数据模型上可落地为规范字段的标准。
工作流引擎:
标准的BPMN。主要问题是MDM使企业额外增加另一套工作流引擎、审批系统,工作流的审批和维护都要到这个系统。所以现在的MDM工作流更多复用OA系统的工作流,而不是单独使用MDM系统内建的工作流。
主数据接口(推、拉):
由主数据管理成熟度Level3,推的模式会导致网状结构,整个架构难以维护。拉的模式随着企业建立统一的数据服务管理,进行统一管理。
主数据管理的两种模式:
主数据管理在行业有两种方式,一种为集中式,另一种为协作式。集中式是指主数据管理的功能嵌入到业务流程中,由主数据管理系统生成主数据并赋予唯一编码,其他相关系统仅作为使用者,实现主数据的集中创建和维护。协作式,作为事后的管理,由各自业务系统生成并维护,主数据管理系统再做事后的整合。
随着企业逐步将旁路式数据分析平台转为数据底座全面支撑事务型业务系统,一些企业在数据底座上开放一个主数据区域,在上面进行主数据模型设计。如下图是某企业的供应商主数据模型设计。
参考数据管理并不是孤立的仅适用于主数据,参考数据需要统一在数据治理平台中进行管理,参考数据可以与数据标准及数据资产直接建立映射关系,进而可以将参考数据生成数据质量检核规则。
主数据是黄金数据,更是需要进行严格治理,包括数据认责、数据标准落标、数据质量验核等。随着数据架构的逐步演变,传统独立MDM会越来越轻、越来越弱化,逐步淘汰。
| MDM核心功能 | 传统独立MDM | 新型主数据管理 |
| 主数据模型设计 | 单独割裂的 | 统一数据架构融合 |
| 主数据参考数据 | 单独割裂的 | 统一数据治理 |
| 工作流引擎 | 单独割裂的 | OA工作流 |
| 主数据接口、服务 | 单独割裂的 | 统一数据服务管理 |
| 数据质量 | 无 | 统一数据治理 |
| 数据标准落标 | 无 | 统一数据管控 |
| 数据治理-认责等 | 无 | 统一数据治理 |