共计 3844 个字符,预计需要花费 10 分钟才能阅读完成。
作者丨 石秀峰
全文共 3765 个字,倡议浏览 8 分钟
数据中台为什么要建标签体系,分类它不香吗?
在泛滥的数据中台的解决方案中,一个叫做“标签核心”或“标签体系”的利用,简直成了数据中台的“标配”。
乍一看,标签体系就像一个树状的分类。
因而,有专家吐槽:“当初讲啥数据标签,数据类目,跟 SAP Classification 比真是弱爆了”。
注:SAP Classification 为 SAP 产品中的一个分类零碎,它反对以有序的构造将特定对象(例如,文章和站点)组合在一起。它的基本功能是为各种不同类型对象的所有属性特色提供存储库。而后将类似特色的对象分组到类中(“分类”对象),以便零碎能够更容易地在事务中找到它们。
那数据标签到底是什么?它与数据分类体系相比,是“真的香”,还是“弱爆了”?
概念的廓清
无论是在数据中台,还是传统产品设计中,绕不开的几个概念:分类、属性、标签。
1、什么是分类
分类,就是指依照品种、等级、性质或特色的归类。也就是把雷同属性或特色的“对象”归集在一起,造成不同的类别,不便人们通过类别来对“对象”进行的查问、辨认、治理和应用。“对象”能够是人、产品、物料或其余实体,例如:人能够分为男人、女人,也能够分为老年人、中年人、青少年。
2、什么是属性
属性是事物所具备的性质或特色,重点强调的是事物自身,例如:人的性别、身高、胖瘦、年龄、性情等都是人的属性。能够将某个事物的属性形象进去作为事物的分类,如咱们上边举的例子,男人、女人是依照性别属性对人的分类;老年人、中年人、青少年是依照年龄属性对人的分类。事物能够依照属性来分类,分类也是事物的属性之一。
3、什么是标签
标签,原意是表明物品的品名、分量、体积、用处等信息的简要标牌,例如:商品标签、图书标签、车检标签、文件标签、服装吊牌等。从这个概念衍生到网络标签,是人工或零碎主动或用户自发的,通过相关性很强的关键字对事物或内容进行形容,帮忙人们分类内容,以便于检索和分享。例如:咱们也能够给“人”这个对象打上男人或女人,老人或青年的标签。可见,标签也有维度或分类,而属性也是一种标签。
分类 VS 标签,到底有啥区别?
前边的例子中,男人、女人,老人、青年,这既能够是对人的分类,也能够是人的标签。分类和标签有时候没有明确的分界线,分类能够作为一个标签,标签也能够形象出分类。那么,分类和标签到底有什么不同?
对于这个问题,知乎上网友的一个答复挺有意思的:
分类因为只能隶属于一个,所以往往带有果断和不失当的色调,它是一个“is a”的问题,属于本质论的领域,而对事物的“实质”的认定,严格来说,这事只有上帝能力做,换句话说,谁做都不适合。标签则不同,它是一个“has a”的问题,说某个货色有某种属性,要求就没那么严格了。
笔者了解:分类是一种谨严的数据组织形式,个别依照一个或多个维度自上而下、从整体到明细的穷举,遵循“互相独立,齐全穷举”的准则。而标签是一种灵便的数据组织形式,放弃大而全的框架,基于业务场景自下而上地倒推标签需要。
除此之外,分类和标签还存在如下不同点:
1、分类个别是面向团队或组织的,重视标准化;而标签能够面向组织,也能够是面向集体,重视的是个性化。
2、分类具备排他性,分类之间是独立的、不能穿插;而标签容许穿插,标签之间能够互相关联、相互依赖。
3、分类体系须要当时布局,在标准化的框架下进行应用;而标签能够动态的,也能够是动静的,容许随时增加。
4、分类重视结构化,具备层级管制,是一个树状构造;而标签的构造是涣散、灵便、凋谢的,整体看是一个网状结构。
(图片起源:PMCAFF 产品社区《常识治理——如何应用印象笔记的多级我的项目标签做常识分类管理》)
分类 VS 标签,哪个香?
在数字化利用中,分类和标签其实根本无法分出个伯仲。标签体系也须要肯定的分类,而基于某个维度的分类也能够作为一种标签,只是他们反对的利用场景或有不同。
分类始终存在,它源于人的认知,能够追溯到人类的起源。
在几百万年前的原始部落,人们将打回来的猎物、采集回来的种子进行分类寄存,以便存储和治理。分类的作用天然不用多说,它能够让咱们条理清晰,档次清晰,高深莫测的辨认和治理事物。
即便在当今由互联网、计算机形成的数字化世界中,分类体系也始终是咱们组织数据、解决数据、查问数据、治理数据的一个重要的伎俩。
在传统企业的信息化建设中,应用更多的是分类,例如:ERP 中的物料分类、人员分类、客商分类等。一套迷信、谨严的分类体系是企业的“人、财、物、进、销、存”等业务流程无效治理的根底,在企业治理中施展着重要的作用。一家企业的“物料分类”科不迷信、规不标准,在很大水平上可能反映这家企业的治理的规范性状况和精细化水平。上文咱们提到的 SAP Classification 就是这样一个能够依据事物属性特色进行多维分类体系的零碎。不仅 SAP,像 Oracle、用友、金蝶等 ERP 大厂,同样也有相似的多维数据分类体系。
标签(网络标签)是随着互联网倒退产生的,最早用在博客、文章的内容分类中,不便用户治理和聚合内容。随着大数据的倒退,标签体系的作用也越来越大,被互联网企业宽泛应用,通过特色汇合并关联打标签的对象,对剖析对象生成画像,开掘对象的价值。例如:各大互联网 APP(淘宝、今日头条、抖音等)都有一个基于标签体系的举荐引擎模块,通过用户动态属性和行为属性给用户打标签,造成 360 度用户画像,而后依据用户的偏好将信息或产品推送给用户。
因而,分类 VS 标签,根本无法区别哪个更“强”或者哪个更“弱”,依据不同的利用场景抉择不同的体系就好了。
在企业的数字化建设中,须要分类和标签联合应用,能力最大化施展数据效力、开掘数据价值。
数据中台为什么须要标签体系
上文中咱们说过,传统企业的信息化应用更多的是分类体系,而标签体系是互联网企业的“致胜法宝”。
随着数字化时代的到来,掀起了传统企业数字化转型的浪潮。从技术侧来看,转型就是拥抱互联网,战略性的应用数据和 IT。在这场数字化的改革中,数据中台被认为是赋能企业数字化转型,实现降本增效的新引擎。
对于数据中台的文章,笔者也写了很多了,咱们再回顾一下它的概念:数据中台是数据 + 技术 + 产品 + 组织的有机组合,是快、准、全、统、通的智能大数据体系。与数据仓库等传统数据工具相比,数据中台是一种新的理念,以“技术 + 业务”为双驱动,是企业发展新型经营的一个中枢系统。
因而,如果你将数据中台定位成一个存数据、管数据的技术平台,那或者有“分类体系”就能够了。如果你的数据中台定位的是企业数字化转型的经营中枢系统,要实现对前端业务的反对和赋能,那“标签体系”就是数据中台一个标配。起因前边介绍过,分类是自上而下的布局,偏重标准化,标签是自下而上的倒推,重视业务场景。
“数字转型,场景为王”,在“技术 + 业务”双驱模式的数据中台中,标签体系、数据萃取将助力企业经营转型降级。
数据中台生产数据标签的四个步骤
商务单干是指所有流动中与人,公司单干而产生的商务活动,以盈利性和商业性的单干为根底。从事商务活动的企业或人必须有肯定的资格。
在经验过“追捧”和“质疑”等种种考验后,数据中台在基于业务驱动的标签体系助力下,正在用事实验证其价值。对于数据中台标签体系的建设,能够关注公众号(谈数据),浏览《数据中台:基于标签体系的 360°用户画像》一文。
上面咱们简略介绍下数据中台如何通过加工和生产数据标签,从而助力企业实现数字化转型的,这个过程大抵可分为四个步骤:
第一,须要从业务视角对企业数据进行梳理,并将各业务域、各渠道、各类型的数据进行采集和汇聚。
第二,通过对数据进行分类解决,从中提炼出可复用的行为元素(业务线、实体对象、实体属性、动作等),通过积淀行为元素,能够更好地标准起源数据。这里业务线是在不同业务经营线,例如:某造纸公司有生存纸经营线,文化纸经营线、工业纸经营线、特种纸经营线等。实体对象是指操作和被操作的各商业主体,例如:用户、产品等。实体属性是指实体对象的属性特色信息,例如:用户的年龄、性别、爱好等。动作就是主体收回的操作,例如:询价、购买、浏览等。
第三,依据对象的行为元素给对象打上相应的“标签”,以反对信息查问、信息推送等利用。与传统博客、CMS(文章管理系统)的手动给内容打标签不同,数据中台是依据对象的行为规定主动给对象打标签,并且能够设置行为数据的工夫衰减算法,为不同标签调配不同的权重,造成全面的“用户画像”,做到“比用户本人还理解他本人”。
第四,各相干利用间接调用数据中台的标签体系、画像服务,反对企业的精准营销、共性举荐、渠道优化、产品翻新等利用场景。
其中,执行第二、第三个步骤的前提就是要做好标签类目体系的布局。也就是说,标签体系也是具备肯定的分类构造的。例如:用户标签能够依照标签的管制深度划分为根本属性标签、行为属性标签、商业属性标签等;也能够依照数据中台的数据分层构造,分为事实标签、模型标签、预测标签等。请参考《数据中台:基于标签体系的 360°用户画像》
写在最初的话
分类体系和标签体系虽各有各的实用场景和偏重,但它们都是企业数据中台理念落地的要害因素,帮忙企业积淀数据资产化,优化数据服务,助力企业落地数字化转型。分类体系可能帮忙企业迷信、无效的组织数据,布局标签类目;标签体系可能萃取和精炼数据服务,并对数据分类进行反向优化。在企业数据的治理和利用中,它们相互配合、互为撑持,不仅可能让企业无数可查,无数可用,而且可能让企业的数据用的更好。