共计 2607 个字符,预计需要花费 7 分钟才能阅读完成。
随同着互联网、5G、大数据的蓬勃发展,数据俨然已成为企业不可或缺的重要资产,数据管理的意义愈发突出,但想要治理好数据却并不是一件容易事,为什么呢?
首先看一下数据的定义:
数据是指对主观事件进行记录并可甄别的符号,是对客观事物的性质、状态以及互相关系等进行记录的物理符号或这些物理符号的组合。它是可辨认的、形象的符号。——百度百科
数据是通过观测失去的数字型的特色或信息。——维基百科
结合实际状况艰深来讲:数据是企业倒退或商业行为中获取、用于企业的发展壮大,带来丰盛物质收益的同时,也会帮忙企业不断进步的虚构资源。
其次,需明确数据管理的定义:
数据管理,即对数据资源的治理。依照 DAMA 的定义:“数据资源管理,致力于倒退解决企业数据生命周期的适当的建构、策略、实际和程序”。这是一个高层而蕴含宽泛的定义,而并不一定间接波及数据管理的具体操作。——维基百科
利用计算机硬件和软件技术对数据进行无效的收集、存储、解决和利用的过程。其目标在于充沛无效地施展数据的作用。实现数据无效治理的要害是数据组织。——百度百科
相比百科百度中偏差计算机领域的定义,维基百科更合乎古代企业数据管理的定义。
结合实际艰深来讲,就是企业倒退过程中数据量一直攀升,数据在帮忙企业倒退时,也带来诸多问题,因而,企业须要有一套整体齐备的理念、程序、架构治理数据,让数据更好的为企业所用。
为什么要治理数据?
企业治理数据,与咱们普通人理财很类似。但一大重要不同点是:企业治理数据是心愿数据可能更高效且低成本运作以带来商业收益。但正如理财有危险一样,没想分明为什么要治理数据前,不要间接下马一个数据管理我的项目,也不要去洽购数据管理产品,首先须要搞清楚,数据管理的意义在哪里,能为企业带来什么价值?
治理数据的实质
企业心愿通过治理数据来低成本高效的实现特定目标。这句话有三个重要关键词,实现特定目标、低成本高效、通过治理数据的形式。咱们逐个剖析:首先治理数据是专业化的工作,因而人才是第一因素,正如战场上不能要求飞行员去拼刺刀一样;其次,低成本高效,即要明确各数据理论价值,排列数据优先级,及时淘汰无用数据;最初,实现特定目标,治理数据务必要有本人的目标,坚定不要为了治理而治理。
那么,怎么来治理数据呢?
答案:用数据来治理数据。治理数据的前提是能把要做的事件量化,事件量化后也成了数据,并且咱们须要用数据进行工作决策和治理。其次,还须要有一套卓有成效的治理办法。
有了目标和办法后,就要开始制订数据标准
制订数据管理标准时比拟难,需围绕指标边制订边实际,没有最好的制度,只有最适宜本人的。
上面做一个掂量数据管理能力的评估题目,一要量化,二要靠机器答复,三要半小时内答复。
- 是否间接给出每张表对于数据变现的价值?或如果这张表不出,会带来多少潜在损失?(虚构指标都能够)。
- 是否间接给出每张表的运行品质报告?是否依据优先级给出运行优化的具体倡议?
- 哪些表能间接下线?
你会发现要答复这些问题,不仅是建个数据管理系统那么简略,须要制订相应的标准和规范。
如果须要晓得每张表对于数据变现的价值,必须有利用跟表的关系,因而,开发上线的时候必须制订标准,起码要提交映射关系,同时为了避免两张皮景象,必须依赖自动化的零碎。
如果须要晓得每张表的数据品质报告,必须制订相干的质量指标,并可能及时预警和解决,这个须要一套数据品质监控制度。
如果须要确定哪些表能间接下线,必须制订一套数据表生命周期管理制度,须要有表的比方血统和影响剖析,否则怎么晓得有多大影响?
如果要让运维人员晓得这些表谁是谁,则必须有好的数据字典,明确表命名标准和口径定义,以升高治理老本。
如果….
你看,所有的数据管理规章制度其实都是为了确保目标达成,由此会延长出一个宏大的数据管理体系,但还是要懂得能抓住实质。因为一开始,不可能想到这么多,能做这么多,需从根源开始思考从何动手。
说完制度,接下来就要提到数据管理工具。
工欲善其事必先利其器。以后数据量愈发宏大,靠人肉难以保障稳固且风险性微小,因而数据管理工具在古代企业中越发重要。
之前微盟程序员删库跑路事件传遍全网,几行代码,让上市公司微盟的市值一天内蒸发超 10 亿,数百万用户受影响,间接间接的损失难以计量。这个“段子”一样的事件,无疑给各大公司敲响警钟,尤其是数据管理并不标准的中小公司,如果这样的删库跑路事件产生,产生的成果将无疑是毁灭性的。
能够看出,想要保障企业数据的稳固运行,数据的管控和审计无疑是十分重要的,对于数据管理者来讲尤其如此。企业中对不同层级的开发人员需制订具体的数据操作权限,哪些容许,哪些不容许,应明确指出。而且用户在权限内对数据做了哪些事件,尤其是高危事件,应要做到具体的审计剖析,这两点笔者认为是最必不可少的。
另外,数据管理的可视化也十分重要,有些公司的 ETL 工作多达成千盈百个,能疾速简略的判断工作是否运行胜利也很重要,它将间接决定到运维的工作量和难易水平。
以后数据管理的产品并不少,但要想面对复杂多变的企业环境,不同的数据库状况,不同用户的操作习惯等,往往能达到的成果无限。
怎么能力算是好的数据管理工具?
首先,肯定是可能融入到企业的生产环境中去,这是大前提。
其次,以后企业要用到的数据库品种越来越多,如 NOSQL、NEWSQL、国产数据库等,所以要在一个平台内反对罕用的各类数据库,而不须要关上一大堆工具。
另外,以后云和 Web 的利用越发宽泛,对于企业团队而言,如果能在云端部署好一套零碎,不必每个人再去下载配置,对立部署,对立应用,加强团队之间的合作,那将会大大节俭团队工夫,提高效率。而且,数据操作体验和效率也不可漠视,平时工作中 DBA 和开发罕用到的性能应是标配。
最初便是最重要的数据安全。对于 DBA 而言,这里最根本的两项刚需性能可能是:权限管控和审计。
数据管理的一些思考
数据管理是个系统性的工程,波及到企业很多流程的再造和新机制的建设,比方标准开发流程等,影响也是全方面的,也须要博得管理者的反对,不然也会举步维艰。
另外,数据管理是个专业化的工作,要有专业化的人全力来对应,其余例如工具等都是辅助,来到业余的人才,往往也不会达到很好的成果。
总结
将来时代,数据将会愈发宏大,数据管理工作也将更加简单艰难,这既是给数据从业者的挑战,也是时代赋予的机会。
基于 Web 的对立数据管控工具 CloudQuery—— https://cloudquery.club/