关于数据分析:奥运奖牌榜中的数据治理问题

33次阅读

共计 1309 个字符,预计需要花费 4 分钟才能阅读完成。


1. 浅谈奥运

奥运会完结了,中国队取得了 88 块金牌,位列世界第二,真是太厉害了。

这时有人发表了不同意见,“港澳台”也是中国的,中国应该是第一才对!

作为不折不扣的爱国主义者,以及始终以来的坚决拥护国家对立的信念,小编是动摇的批准“港澳台”属于中国的。

那么为什么在此次奥运会中,奥组委把中国队和中国香港、中国台湾、中国澳门离开了呢?这就要谈到奥运会中的“法“了

2. 奥运会中的“法”

首先奥运会,可不是以“国家”位单位,而是以“组织”为单位的。统计奥运奖牌榜,天然得恪守奥运会的“法”。

奥林匹克小家庭 (Olympic Family) 是对所有参加奥林匹克运动的组织和集体的统称,其中国际奥委会、国家和地区奥委会和国内单项体育联合会等 3 大组织被称之为 ” 奥林匹克三大支柱 ” (Olympic Tripartite)。

三大支柱在奥林匹克运动中承当着不同的工作:

国际奥委会负责领导和协调;
国内单项体育联合会负责各种技术性事务, 如组织较量、制订比赛规定等;
国家和地区奥委会则负责在本地区发展各种流动, 组队参加奥运会等。

组织的概念是大于国家实体的。国家是组织,地区是组织,各地奥组委适合组织。所以奖牌榜的表头都是这样的:国家 / 地区。

所以,“组织”就是奥运会的“主数据”。这些主数据是必须由国际奥委会审批之后能力取得“非法”身份,参加到较量的。

香港、澳门尽管都曾经回归祖国,然而仍然能作为“地区”参加奥运会,并在奖牌榜上独自统计,就是这个起因。

再比方,这次的奥运会,俄罗斯因为被国内体育仲裁法庭(CAS)认定俄罗斯反兴奋剂核心违规,导致不能加入东京奥运会。

所以这次俄罗斯运动员是以俄罗斯奥委会的名义加入的,获奖之后挂的也不是俄罗斯国旗,而是这个:

3. 数据的“法”

奥运会的“法”有了,那数据的“法”也就有了。因为,数据的“法”就是业务规定。

业务上定义分明了,数据的定义能力清晰,才有“法”可依。而数据的凌乱,都是业务上定义不清导致的。

以奥运会为例,奥运会官网统计奖牌榜,是以组织为单位统计的。“组织”就是奥运会体系里的主数据,这是外围数据,必须权威且不可挑战。

然而大家都以“国家”为单位,这就是随便定义口径,挑战数据的“法”,这不就是“口径不统一”,从而导致数据对不上么?

对于“国家”的定义不一样,所取得数据后果也是不一样的,如果说“中国代表队”那么咱们就应该说取得是 88 块奖品,然而如果说是“中国所有代表队”,那么咱们取得了 106 块奖牌,这相对是无可非议的。数据就是数据,每一块奖牌都有据可查,最终的后果,齐全取决于业务层面要怎么表白。

产生中国是 106 块奖牌还是 88 块奖牌这种争执,问题基本不在哪个数据是对的,哪个数据是错的,而是在于业务定义没有对立。而这件事最终的后果肯定是要对立想要表白的指标,也就是对立外围业务诉求。

4. 数据治理的“法”

通过奥运会奖牌榜统计的案例,咱们就能总结出以下三点:

1、业务规定就是业务的“法”;

2、数据的“法”就是业务规定;

3、主数据就是数据的“法”

因而咱们还能推导出更多的论断:

1、数据的权威来自于业务的权威;

2、业务的凌乱必然导致数据的凌乱;

3、业务指标的对立,是数据对立的前提;

4、数据治理,实际上是业务治理。

正文完
 0