关于数据分析:业务场景下数据采集机制和策略

93次阅读

共计 2289 个字符,预计需要花费 6 分钟才能阅读完成。

一、场景形容

做面向 C 端用户的产品,非常依赖用户数据的收集,上面都见过这样一张数据分析图,通过链路上各个环节的数据采集,剖析比照出曝光产品的交易量:

通过对商品的浏览 - 点击 - 交易页面 - 领取购买等,剖析产品的交易场景,这里是从大的业务方面察看数据的链路,实际上在剖析的时候要思考很多细节问题。

二、数据起源

用户数据来掂量用户或者产品的各方面纬度是最具备说服力的,所以在互联网的产品前期开发和优化过程中,对数据的采集和治理始终都是十分重要操作。

当初产品常见的客户端有 PC 端、H5 端、APP 端、小程序等各个场景的入口,更有一些物联网设施或者专门做的数据采集机制,不同的场景下的数据类型都是要辨别的。通过不同端口下各类数据埋点,获取各个场景下的不同事件的数据来剖析产品的优缺点,获取具备建设性的剖析后果。

例如模块一中的案例:通过对端口的剖析如果在 APP 端商品 A 的举荐和交易率最高,在小程序端举荐成果不好,那就能够思考针对 APP 和小程序端采纳不同的举荐机制。

三、事件类型划分

数据须要采集,并且要辨别不同端口的数据只是根本的意识层面,思考采集数据的事件类型是最根底的操作。这里要从产品的特点去思考,不同一概而论。上面提供一些根底采集数据和一些常见案例,对于外围业务数据绝对都是精密和残缺的,根本具备读库间接剖析的条件。

根底信息

属性 字段 类型 形容
操作终端 app_client String Android/IOS/ 小程序 /H5 等
终端版本 app_version String 版本号标识
用户标识 user_id Integer 用户 ID
网络地址 ip_address String 用户 IP 信息

这些信息是存在任何采点数据中的,通过这些根底信息采集,用来剖析不同端口下用户的特点,以此能够进行差异化的治理和经营。

登录信息

属性 字段 类型 形容
登录工夫 login_time Date 用户登录工夫
在线时长 online_time Long 在线应用零碎的工夫

通过对登录和在线工夫,以及一些应用信息,判断该类用户活跃度,是否须要重点经营或者营销激活。

业务根底

属性 字段 类型 形容
服务类型 service_id Integer 不同的业务服务
模块划分 model_type Integer 例如订单 / 领取 / 物流等

以此作为业务数据采集的根底信息,用来对业务数据做整体的划分和剖析,具体的细节数据须要依据具体场景设计。

商品案例

属性 字段 类型 形容
商品信息 product_id Integer 商品信息
展示地位 position_id Integer 例如:列表 / 举荐位 / 广告位
店铺信息 shop_id Integer 所属店铺信息
搜寻信息 key_word String 搜寻关键字
以后单价 unit_price Double 商品以后单价
以后销量 sales_num Long 商品以后销量

这里是依照用户浏览行为做的一个简略的数据采集信息,这种机制在理论的电商 APP 中很常见,产生点击或者搜寻的商品会被重点举荐,如果没有这类动作,则依据日常浏览信息做举荐机制。在理论的开发中,采集的数据远比这里简单,须要依据理论业务须要去考量。

营销案例

属性 字段 类型 形容
流动地位 location_id Integer 入口位 / 疏导页 / 举荐位 / 分享链接等
营销产品 product_id Long 营销流动主打产品类型
产品详情流量 detail_num Long 流动产品浏览量统计
订单确认页 detail_num Long 流动产品浏览量统计
流动交易统计 trade_num Long 流动最终转化统计

通过经营流动进行产品营销,流动完结后对数据进行复盘统计,而后依据流动轨迹数据的剖析,均衡营销产生的价值和老本,一直调整流动策略,优化经营思路。

四、实现形式

1、业务层面

从业务角度来看,除了一些用户无感知的采集操作之外,还能够基于问卷调查形式,例如很多 APP 在应用一段时间后都会弹出用户评估相似的评分零碎,或者意见留言的入口,更加间接的收集用户反馈信息。

2、技术层面

最常见的就是 SDK 埋点技术,针对特定用户行为或事件进行捕捉、解决和发送给服务器的相干技术及其施行过程。这种形式用来解决一些非核心业务非常常见。如果是一些外围业务,可能须要自定义的形式采集数据,防止造成数据泄露的问题。

3、数据积攒

当业务一直倒退,须要剖析的场景会越来越简单,而且采集的数据量达到肯定规模之后,数据管理的和剖析的难度就会变大,就会须要专业化的流程和智能工具,例如 BI 工具,可视化组件,数据大屏,多场景联结剖析等。

五、源代码地址

GitHub·地址
https://github.com/cicadasmile
GitEE·地址
https://gitee.com/cicadasmile

举荐浏览:编程体系整顿

序号 项目名称 GitHub 地址 GitEE 地址 举荐指数
01 Java 形容设计模式, 算法, 数据结构 GitHub·点这里 GitEE·点这里 ☆☆☆☆☆
02 Java 根底、并发、面向对象、Web 开发 GitHub·点这里 GitEE·点这里 ☆☆☆☆
03 SpringCloud 微服务根底组件案例详解 GitHub·点这里 GitEE·点这里 ☆☆☆
04 SpringCloud 微服务架构实战综合案例 GitHub·点这里 GitEE·点这里 ☆☆☆☆☆
05 SpringBoot 框架根底利用入门到进阶 GitHub·点这里 GitEE·点这里 ☆☆☆☆
06 SpringBoot 框架整合开发罕用中间件 GitHub·点这里 GitEE·点这里 ☆☆☆☆☆
07 数据管理、分布式、架构设计根底案例 GitHub·点这里 GitEE·点这里 ☆☆☆☆☆
08 大数据系列、存储、组件、计算等框架 GitHub·点这里 GitEE·点这里 ☆☆☆☆☆

正文完
 0