关于javascript:前端异常监控体系

5次阅读

共计 919 个字符,预计需要花费 3 分钟才能阅读完成。

背景

目前所有前端我的项目(无论测试 / 上产)均无异样监控, 导致了以下几个典型问题:

  • 无奈获知用户应用的浏览器类型
  • 无奈获知用户端是否能够失常应用(有无前后端 Bug 阻塞用户)

    • 上线后无奈被动取得用户应用状况,只能通过人工征询
    • 无奈进行 Bug 追踪
  • 用户报 Bug 后(非技术人员), 短少问题定位所需的必要信息,复现问题老本极高.
  • 无奈比照历史版本的 Bug 状况
  • 呈现线上 Bug 后,无奈获知 Bug 影响范畴,无奈进一步决定是否须要紧急发版
  • 失去监控的线上 Bug 如果没人上报,会影响用户理论业务,影响用户满意度,进而影响公司业务

概括来说:1. 线上谬误无感知;2. 谬误定位老本高;3. 升高用户满意度

指标

  • 给研发团队问题感知能力
  • 给研发团队疾速定位技术问题的能力
  • 给研发团队 / 产品经理比照版本品质,继续改良产品的根底能力
  • 给研发团队 / 产品经理是否做 hotfix 的决策能力
  • 升高问题反馈的沟通老本,优化问题反馈链路(CSM —  产品经理 —  技术负责人 —   研发工程师 —  测试工程师)
  • 补充测试团队未笼罩的场景

投入产出评估

计划比拟

计划 年费价格(规模:撑持 BIV 部门的大量利用) 年费价格(规模:撑持整个研发核心) 其余 劣势 / 劣势 比拟
应用三方服务 (Fundebug) 159 * 12 = 1908
数据保留在三方
数据仅保留一个月
30 万 起步
数据保留保留在公司
应用三方服务 (Sentry) 80 7 12 = 6720
数据保留在三方
数据能够保留三个月
900 7 12 = 7.56 万 起步
数据保留在三方
数据能够保留三个月
自建监控体系

 

自建异样监控体系(第一版),须要实现以下组成部分,以实现体系的最小闭环.

组成部分 角色性能 研发资源 是否一期必须
异样上报 SDK JS 库,每个我的项目中引入后,手动 / 主动实现上报
日志解决(荡涤 + 聚合 + 长久化) 服务,ES 荡涤 / 聚合 + MySQL 长久化 是(但一期能够没有数据荡涤 / 数据聚合局部)
监控平台 上报数据可视化,Nodejs 服务 + 前端单页利用
告警机器人 服务,依据特定条件,触发钉钉报警等.

需要拆解

1. SDK for Web

性能列表:

形容 备注
反对疾速接入 SDK 通过 npm 形式引入, 并通过简略配置能够疾速引入我的项目
反对手动上报谬误 开发者能够在我的项目中自行抉择上报地位,进行自定义谬误上报

研发打算

正文完
 0