问题发现定位

问题发现定位平台功能点需要全面，实现大多基于日志（收集多KAFKA，分布式存储），日志检索（多采用ES）。链路分析再次基础上做采样聚合，接口级别的非采样在监控中做（时间流存储，监控报警阈值模型智能预测等），日志针对性做些细粒度的链路分析。技术涉及不多，主要是日志压缩和索引的建设。功能点成体系就好。本文重点关注这个。更多工程内容见：https://segmentfault.com/a/11…

日志规范。定则规范

全链路传递

1.nginx
traceid当前由几部分组成：（nginx的ip） + （生成的时间） + （生成id的nginx的启动时间 + 生成id的nginx的进程号）+（循环自增id + 末两位固定02）
nginx扩展+http header传递
2.thrift
利用thrift 0号位空缺作为header使用
3.mq ？？

问题发现：

1.odin实时监控，阈值报警。（接口维度，机器维度）
2.woater实时监控，智能报警
3.srm灭火图/上线事件监控
4.安全扫描

问题定位

5.故障分析平台（全链路故障点）
6.问题分析平台（搜索：ES）
kafka+ES
详细日志查询：大量debug/trace等日志。取代机器+grep：ES获取机器索引时间+日志压缩/解压缩，时间定位查询
7.性能分析（抽样）

业务评估

1.机器调用关系
2.服务依赖关系（静态），次数（统计）
链路分析，延时（采样平均），调用次数（静态，动态采样）
3.模块性能分析（采样统计）
4.专项（mysql,定位到代码和人）

成本管理

1.资源成本统计
2.实时资源占用监控

日志规范。定则规范

全链路传递

问题发现：

问题定位

业务评估

成本管理

整体解决思路

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

问题发现定位

日志规范。定则规范

全链路传递

问题发现：

问题定位

业务评估

成本管理

整体解决思路

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复