十分钟构建双十一交互分析大盘

36次阅读

共计 1708 个字符,预计需要花费 5 分钟才能阅读完成。

提到双十一很多人第一印象是一张成交金额跳动的炫酷大屏,的确大盘在阿里双十一中几乎是每个团队标配,例如:
CEO 看业务:把重要数据放到一张大屏上,简洁而有冲击力运营看效果:把多个指标放在一起,有利于综合分析定制投放策略开发看流量:服务请求延时,排队情况,掌握实时性能与动态监控看水位:集中监控整体服务的状态,有利于快速的做出响应大盘方案选型典型方案是流式计算架构:
数据采集:利用 Agent、API、SDK 等采集各源头数据中间存储:利用类 Kafka 软件进行生产系统和消费系统解耦实时计算:环节中最重要环节,订阅实时数据,通过计算规则对窗口中数据进行运算结果存储:计算结果数据存入 SQL 和 NoSQL 可视化:通过 API 调用结果数据进行展示在阿里集团内,有大量成熟的产品可以完成此类工作,一般可供选型的产品如下:

对大盘进一步诉求虽然前期做了大量准备工作,但运营、研发和运维等除了看大盘外,还会围绕整个活动的运行做大量工作,例如:
运营对每个类目的细节,下单数目,用户量预期水平等进行大量分析,对某些用户群体激活和促销研发关注请求流量,用户延时体验,定位和分析各种原因运维分析系统的水位,查看各资源的分布,调度资源以确保稳定性
从上述例子中可以看到,除了数据的呈现之外,我们需要对大盘融入“交互式分析”的能力。给大家介绍一种选择:通过日志服务(LOG,原 SLS)一站式的查询分析 LogSearch/Analytics API 直接对接可视化大屏。​ 大屏的选择可选方案有日志服务 Dashboard,Grafana,Datav 等,也可以通过 API、JDBC 接口对接自己的可视化大屏和第三方的软件(例如 Tableua)。日志㐏对三种大屏提供了插件,只需在配置中直接使用 SQL 进行计算,并展示结果。

日志服务 Dashboard 主要面需要交互式分析的查询需求,例如发现错误时,需要下钻定位原因。跟踪到某个类目中查看细节,对比同比与环比数据。该方案有如下特点:
实时性强
从数据产生,秒级别即可在日志服务看到数据。动态刷新,秒级别即可计算出指标,展示在大屏上。秒级精度
日志时间精确到秒级别。灵活查询
使用 SQL 进行交互查询,可以进行探索式分析,快速进行假设和验证。可反复在原始数据上进行任意维度的计算。而流计算在计算完原始数据后,即抛弃了原始数据,若想回溯调整查询,基本不可能。所以日志服务的交互式查询可谓灵活很多。机器学习支持
时序类机器学习函数,帮助发现业务规律与趋势分类与聚类函数,帮助发现与定位异常

使用步骤以日志服务 dashboard 对接为例,要对接一个大屏,首先要接入数据,然后编写 SQL,配置仪表盘视图。
接入数据
日志服务提供 30+ 数据接入手段可以满足各种数据源诉求,具体参考文档。

调试 SQL+ 机器学习函数
我们在日志服务查询页面,通过 SQL 语法,计算出需要的指标。SQL 语法参考语法文档。

配置视图并保存
在配置好的大屏中,使用下钻深入分析结果:
日志服务控制台内置 14+ 类型视图,用于可视化展示 SQL 计算结果,具体参考文档

基于日志服务大盘案例从日志到双十一大屏只要一步:LOG/SLS+DataV 打通 DataV 无缝支持 LOG API,使用 SQL 进行实时计算,统计 Nginx 日志的 PV、UV 网络等指标。
图:datav 大屏
5 分钟搭建网站实时分析:Grafana+ 日志服务实战
图:grafana 大屏
日志服务 Nginx dashboard:使用日志服务内置的地图、饼图、折线图等可视化 Nginx 日志指标
图:日志服务 dashboard
Pangu 2.0 秒级监控 Pangu2.0 是阿里云自研的新一代普惠智能新存储系统。Pangu 基于日志服务搭建秒级监控,Pangu 日志产生后,秒级采集到日志服务,并在秒级别计算出各个机器的 IOPS、延时、吞吐。可迅速发现负载高的机器,及时跟进处理。
Fuxi 双十一资源画像为混部保驾护航资源调度大屏:伏羲是阿里云自研的分布式调度系统。在双十一期间,为了监控所有集群的容量、负载信息,伏羲团队搭建了基于日志服务 +dataV 的可视化大屏。一张大屏囊括了所有的集群信息,看到这张大屏,就像拥有了一张地图,在双十一波涛汹涌的流量面前,做到胸有成竹。

正文完
 0