数据治理那些事(11)—参考数据
上节讲的主数据,主要讲主数据识别和特征及主数据是企业重要的黄金数据,本要讲下和主数据相关的参考数据,通常很多人不太清楚元数据,主数据和参考数据间的关系和适用范围,本节澄清下它们间的关系,为什么很多人分不清呢,因为你没用过或项目中没有涉及过,网上讲的只有有限的例子,不具备说服力,因为没有从概念上来区分,只有归纳是不完全的,主数据和参考数据区别是有几项的,不是用例子说的.
在这我先给结论,再分析为什么?前面讲元数据是定义是什么其实那不是一个定义,只是描述,所以相对元数据来说,范围难以界定就在这,什么都可以叫元数据,那前提是什么叫数据,数据的定义比较容易, 数据(data)是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材。不说数据就说元数据,其实是流氓,但是你看看,有那个文章说元数据时,说了数据的定义,没有吧,再说了,元数据是不是数据?很多人回答不是,元数据是递归的,元数据如果相对它本身的元数据来讲,它就是数据,所以大家在区分事物时,一定先理解概念,理解完元数据以后,再看主数据,主数据通常看作标准和核心的业务数据,那主数据的核心是什么呢?有没有说的清楚,网上更多的描述吧,这就是现在的现象,什么事看起来差不多,大家都知道的事,没有量化,如果不量化能进行信息转型吗?主数据核心是共享和重要性,这通常是业务来定义的,还有它的几个特征用区分到底是不是主数据,参考数据也叫基准数据,通常给别人参考的,实际存在的形式是什么呢?通常是代码表的存在,存在哪呢,我在讲企业级的数据字典中讲过域和代码表吧,那个代码表就是参考数据,大家理解了吧,回到正题,主数据和参考数据如何区分呢?参考数据在数据字典中也是为共享使用的,主数据也是共度使用的,参考数据很多也是核心的,比如客户身份类型,就是主数据和参考数据,很多人认为主数据是表还是属性还是什么,其实主数据看作信息对象,信息对象的最小粒度就是属性或代码,比如一个客户对象,它有很多属性,你认为是客户对象是主数据?还是它的属性是主数据?大家认为呢,所以在实际过程中,大家要实践,不要只看文档或咨询的说的,咨询公司还
说参考数据全是主数据呢,我原来在的咨询公司就是这样说的,你认为对吗?我在主数据的视频中讲了这个问题,所以不要盲信.
我的个人看法是参考数据部分是主数据,主数据也不全是参考数据,这个和很多咨询公司提法不同,理由如下:通常代码表的取值范围有限,参考数据主要是进一步对属性进行说明,它本身是数据,但是主要以代码的形式展现,通常用于共享,但是实例代码值不会无限,这是基本区分的标志,比如客户编号由证件类型和证件号码及客户中文名称生成,客户编号代码是无限多个的,而客户编号如果是参考数据的话无法展现,最多说明编号的生成规则和范围,这就是元数据的范围了,而不是参考数据,重申一点共享性不是区分二者的标志,很多人认为参考可以不共享,只给自己的系统用,但是也没说不能共享啊,我用过的企业级数据字典就是共享的,否则还会叫什么企业级对吧.
我说了这半天,你可能会说,这没什么用啊?在实际中也不一定用的到,是的,实际中可能不一定会用,我在这想说的是逻辑思维,每种概念的一定有它的解决的问题,它解决的问题范围在哪?它为什么要出现,不同概念间的联系如何?如何我们清楚分析,我们如何定义一个问题,问题定义不好,如何解决,我们总说方案啊,架构啊,其实不管什么都是一系列的概念组成的,它们的定义和范围及和环境的关系组成的系统是为了解决或描述现实的问题,如果不求理解,还能做对吗?这些概念和现实中对象是什么关系,是如何映射的,我们知道知识就可以吗?还需要不需要知道运用知识的能力呢?我的文章到现在应该很多了,应该30篇左右了,为什么我一开始不讲数据治理,而是讲认知的问题,那不仅仅对数据治理的认知,对所有的认知可是一样的,如果不了解前面的内容,后面很难学好,不管什么文章和视频,其实最核心的一点就启发,不能安别人说的来做,因为别人做的收获是别人的,即便你按别人的方法做一遍,其实你在走别人的路,是没有太大成果的,无非是重复,还不是定重复的完全.
本来想讲是重要参考数据的内容了,后来一想参考数据没什么说的,还不如就些来说明
一些思维方法,所有的学习是别人教元数据,你自己去掌握数据,从而掌握信息和知识和能力,如果 是只掌握了元数据,不会掌握数据,就和你只会理论,不会实践是一样的,数据中可能会有不符合元数据标准,这部分数据是创新的数据,可能不满足目前的目标,但是它通常也是新的开始,所以说所有的标准是暂时的标准,只有变化的标准才是真正的标准,这就需要变化和标准的度如何掌握,这就是学习掌握的能力,这是你的学习能力,没有人教你,需要你自己是悟和掌握的,
本节讲了主数据和参考数据的不同,并由此说明下相关的思维的问题,希望大家多思考,不要就事论事,而是应该多联想,多问为什么,通常掌握知识和知识能力来进一步掌握和运用知识,正如容易区分元数据,主数据和参考数据一样.还有一点就是为什么数据要分类?大家可以想下,如果这个问题想清楚,很多问题就豁然开朗了.
因篇幅问题不能全部显示,请点此查看更多更全内容