关于数据分析:数据应用场景之标签管理体系

99次阅读

共计 2258 个字符,预计需要花费 6 分钟才能阅读完成。

一、标签简介

标签概念

标签,最后用来对实物进行分类和标记,例如表明物品的品名、分量、体积、用处等简要信息。起初逐步风行到数据行业,用来标记数据,对数据疾速分类获取和剖析。

标签特点

准确形容定位和搜寻,具备生命周期的个性,能够计算,配置和规则化解决。能够用标签来形容各种构造和非结构化 [文档、图片、视频等] 的数据,从而使这些内容被高效的治理。

  • 形容特色:标签[手机色彩],特色[红色,红色];
  • 形容规定:标签[沉闷用户],规定[每日登陆,产生交易];

标签价值

  • 精密经营的根底,无效进步流量精准和效率。
  • 帮忙产品疾速定位需要数据,进行精准剖析;
  • 能帮忙客户更快切入到市场周期中;
  • 深刻的预测剖析数据并作出及时反馈;
  • 基于标签的开发智能举荐零碎;
  • 基于某类下的数据分析,洞察行业特色;

标签的外围价值,或者说最罕用的场景:实时智能举荐,精准化数字营销。

二、标签定义

属性标签

属性标签是形容基本特征,不须要行为产生,也不是基于规定引擎剖析,例如基于用户实名认证信息,获取:性别,生日,出生日期等特色。变动频率极小,且精准性较高。

行为标签

通过不同业务渠道埋点,捕获用户的行为数据,基于这些数据分析,造成后果形容的标签,例如:剖析用户「网购平台」,失去的后果拼多多, 淘宝, 京东, 天猫等。这些都是须要通过行为数据来判断的标签。

规定标签

规定下剖析进去的标签,更多是基于产品或者经营角度来看,例如电商平台须要对会员等级超过 5 级,且近 7 天沉闷的会员发一次福利,这里就波及两个标签利用:1.「会员等级」基于什么规定判断;2.「近 7 天沉闷」如何判断,是基于登录,还是产生交易行为,这些都要能够动静配置,而后基于规定引擎把后果生成。基于动静的规定配置,通过计算和剖析,生成形容的标签,也就是规定标签。

拟合标签

拟合类标签极具复杂性,通过对多种标签智能组合分析,给出预测形容,或者间接给出进阶定义,例如所谓的读心术,即通过多个特色,眼神信息,判断人的心理流动。在机器学习中有一句话:通过长期对用户行为的判断和学习,机器可能比用户还理解用户。

三、标签管理体系

层级分类

标签治理的根本伎俩,通常以行业来分:金融,教育,娱乐等;通过多级分类细化治理。

根底标签

即数据的要害标签,特点准确扁平,不可再细分,用来准确的形容数据,相似元数据。当应用多个标签组合形容数据特色,就会造成结构化的表治理。

标签值类型

值类型:数字,字典,布尔,日期,文本框,自定义等,是对标签具体值的治理。例如标签「性别」,标签值「男. 女. 未知」, 这种典型通过列举字典来形容的场景。

四、标签生产流程

1、根底流程

数据采集

数据采集的渠道绝对较多,比方同一 APP 内的各种业务线:购物、领取、理财、外卖、信息浏览等等。通过数据通道传输到对立的数据聚合平台。有了这些海量日志数据的撑持,才具备数据分析的根底条件。不论是数据智能,深度学习,算法等都是建设在海量数据的根底条件上,这样能力获取具备价值的剖析后果。

数据加工

联合如上业务,通过对海量数据的加工,剖析和提取,获取绝对精准的用户标签,这里还有要害的一步,就是对已有的用户标签进行一直的验证和修复,尤其是规定类和拟合类的相干标签。

标签库

通过标签库,治理简单的标签后果,除了简单的标签,和基于工夫线的标签变,标签数据到这里,曾经具备相当大的价值,能够围绕标签库凋谢一些免费服务,例如常见的,用户在某电商 APP 浏览某些商品,能够在某信息流平台看到商品举荐。大数据时代就是这么令人感觉智能和窒息。

标签业务

数据走了一大圈转换成标签,天然还是要回归到业务层面,通过对标签数据的用户的剖析,能够进行精准营销,和智能举荐等相干操作,电商利用中能够进步成交量,信息流中能够更好的吸引用户。

应用层

把上述业务开发成服务,集成到具备的利用层面,一直晋升应用服务的品质,一直的吸引用户,提供服务。当然用户的数据一直在利用层面产生,在转到数据采集服务中,最终造成残缺的闭环流程。

2、数据聚合池

  • 基于 IDmapping 技术,置换惟一标识[uid];
  • 基于 uid 关联标签,放入计算池;
  • 雷同的 uid 携带的标签会以贪吃蛇的形式运行;
  • 不断丰富该 uid 下携带的标签内容;

以此形式丰盛标签的场景,产生更大的数据价值;

五、源代码地址

GitHub·地址
https://github.com/cicadasmile
GitEE·地址
https://gitee.com/cicadasmile

数据洞察系列文章

题目
数据分析:基于智能标签,精准治理数据
数据分析:数据可视化图表,BI 工具构建逻辑
数据分析:简单业务场景下,量化评估流程

举荐浏览:编程体系整顿

序号 项目名称 GitHub 地址 GitEE 地址 举荐指数
01 Java 形容设计模式, 算法, 数据结构 GitHub·点这里 GitEE·点这里 ☆☆☆☆☆
02 Java 根底、并发、面向对象、Web 开发 GitHub·点这里 GitEE·点这里 ☆☆☆☆
03 SpringCloud 微服务根底组件案例详解 GitHub·点这里 GitEE·点这里 ☆☆☆
04 SpringCloud 微服务架构实战综合案例 GitHub·点这里 GitEE·点这里 ☆☆☆☆☆
05 SpringBoot 框架根底利用入门到进阶 GitHub·点这里 GitEE·点这里 ☆☆☆☆
06 SpringBoot 框架整合开发罕用中间件 GitHub·点这里 GitEE·点这里 ☆☆☆☆☆
07 数据管理、分布式、架构设计根底案例 GitHub·点这里 GitEE·点这里 ☆☆☆☆☆
08 大数据系列、存储、组件、计算等框架 GitHub·点这里 GitEE·点这里 ☆☆☆☆☆

正文完
 0