乐趣区

关于RTC:2年100倍增长背后米连客户服务升级的思考

作者:声网 Agora 林硕

前言

2018 到 2020 年正值视频婚恋社交行业的风口期,米连仅在 RTC 局部费用反对从 50W 飙升到 5000W。客户在与泛滥竞品的博弈中如履薄冰,必须继续翻新才得以保住头部地位。RTC 品质的稳定性也早已成为客户的生命线,因而客户对实时音视频、旁路推流品质稳定性、线上问题疾速剖析定位、用户体验优化等方面对服务提出了更高的要求。随同客户的成长,风雨同舟咱们一路走来,在帮忙客户胜利的路上我也感到肩上重任。作为接口人的我依据客户不同阶段的特点也在踊跃自我调整,更有针对性地为客户最无效的帮忙。然而回头反思仍有诸多不完满之处。特此做出小结,与各位汇报的同时也与客户共勉。

第一阶段:摸索

2018 年 11 月 13 日入职声网后第一次访问客户,我的第一印象是:一间拥挤二十多人的三居室。在有余 9㎡ 的单间中跟 CTO 探讨测试音视频参数。过后伊对 APP 性能简略设计奢侈,场景只有红娘撮合的三人视频相亲。在田间地头、卧室客厅、站卧坐躺 …… 没有亮堂的直播间、业余的声卡、规范的话术。少一分虚夸,多一分实在。


三人视频相亲 & 七人视频娱乐房


三人视频相亲场景音视频参数调优

【摸索阶段特点】

  • 设施性能差但体验不能差 :伊对最终用户大多散布在三四线城市,处于频繁试新阶段,总体音视频用量不大,最终用户大多应用千元 Android 机,网络品质总体较差,用户也在各种场景难以标准。所以米连研发团队十分须要借助 AgoraSDK 的宽泛适配性、SD-RTN 的弱网反抗等性能最大水平优化用户体验,帮忙客户在最艰巨的期间博得客户的

三四线城市用户 Android 机型散布

  • 人手不足但必须三头六臂 :客户团队从 ” 电商 ”、” 直播 ” 到 ” 线上相亲 ” 通过屡次转型调整。人手不足就加班加点、人不业余就多做调研,在最艰巨的环境中却没有放弃对技术以及产品体验的要求。CTO 经常亲自上阵,既要实现代码编写、测试、发版;又要做广告推广、市场调研确认产品后续倒退路线;还要解决线上各种技术和非技术问题。

【服务姿态】

  • 让客户体验最新的音视频技术 :举荐客户紧跟最新版本 SDK,声网每次发版客户也会第一工夫降级。一方面客户享受最前沿的音视频技术,晋升最终用户的体验;另一方面收集客户应用新版本的问题和需要,继续推动外部优化晋升 SDK 的稳定性、易用性。
  • 以用户视角给出产品和技术倡议 :因为客户测试发版尚未建设残缺的流程,线上容易呈现一些未被发现或者未被反馈的问题。我会利用业余时间体验伊对 APP,站在普通用户的视角,记录反馈遇到的问题以及音视频、UI 逻辑方面的优化倡议,帮忙客户优化音视频体验、交互流程体验、业务流程体验。
  • 线上调试案例并积淀通用问题排查计划 :泛娱乐客户个别都音视频品质敏感度不是很高,偶现的卡顿问题个别不会反馈,所以针对反馈的问题,我会分外器重并争取在第一工夫解决。记得客户初期最常见的问题就是回声问题,面对回声运维人员以及最终用户通常不知所措。我第一次收到问题反馈是在凌晨的地铁上,于是第一工夫跟红娘近程,并定位产生回声的起因以及躲避计划。并且将这一类问题造成最佳实际,赋能给客户运维团队并造成红娘音视频设施及常见问题领导标准。后续客户根本没有再反馈过回声问题,根本实现 95% 回声问题在一线消化,大大提高客户运维团队成就感。


旁路推流架构图及问题考察伎俩


回声问题排查思路及解决计划

第二阶段:匀高速增长

2019 年 6 月随着蓝驰创投千万级 A 轮投资以及视频婚恋社交市场的井喷,大量竞争对手涌入这片蓝海,逼迫米连不得不再减速 ……

【匀高速增长阶段特点】

  • 稳固是生命线 :因为强劲的宣传力度,客户用量放弃继续高速增长:每月 PCC 和 PCU 同比继续翻倍。客户过后的要求是:服务端所有资源每月底都需依照上个月峰值用量 300% 进行扩容,务必确保上量期间用户体验不掉线。
  • 新场景疾速迭代 :随着竞争的愈演愈烈,获客老本在继续升高,因而进步客户留存率变得愈发重要。客户的市场策略也从仅提供 ” 相亲服务 ” 向集 ” 社交 ”、“娱乐”多功能与一体的线上青年社区转型。因而须要以最小老本、最快速度构建新场景,试探用户以及市场的接管度。

【服务姿态】

  • 稳当的降级策略 :不再举荐最新版本给客户,而且举荐通过较多客户验证过的版本。并且全程深度配合客户测试过程,及时处理测试过程中遇到的问题,最大水平升高版本迭代对业务稳定性的影响。
  • 联合多产品线综合晋升客户体验 :客户服务端监控、CDN 观众拉流失败应急计划都变成辣手的问题。为了无效帮忙客户优化体验,我联合声网多产品线能力继续帮忙客户晋升对客户数据的收集能力以及异样场景的应答能力。同时最大水平进步客户黏性,构建技术壁垒。

    • 频道内观众端:减少秒开体验,作为弥补策略减少弱网用户在 CDN 拉流失败时继续观看直播的成功率;
    • 服务端回调:帮忙客户服务端可能监控频道内主播退出频道、来到频道事件,并进行全网播送告诉和推送;
    • 流音讯:作为可靠消息备用通道,补强控制指令传输的实时性;
  • 外部推动品质通明的同时增强人工告警 :在客户用量疯狂增长的阶段,体验问题也如潮水般涌来。为了升高客户运维团队压力,帮忙客户疾速辨认最终用户反馈的问题是区域问题还是个例问题,我帮忙客户制订了一系列的保障措施:

    • 短期计划:减少现场保障,确保微信群第一工夫响应。帮忙客户判断上报问题的类型,赋能客户运维团队通过水晶球疾速定位简略问题,简单问题记录必要信息放慢解决效率;
    • 中期计划:在品质通明我的项目落地前,旁路推流、SD-RTN 品质抖动或者后盾变更在及时向客户通告,将影响降到最低;
    • 长期计划:继续推动声网旁路推流产品团队落地品质通明我的项目,继续细化客户监控需要,继续将声网监控指标与客户监控指标对齐升高单方沟通老本。
  • 疾速确认新场景计划 :与米连产品和技术负责人间接探讨新场景需要,联合以后产品组合,帮忙客户以最低老本、最小投入、最短时间上线新场景。


语音 KTV 场景通过流音讯实现歌词同步的计划

第三阶段:精细化经营

【精细化经营阶段特点】

  • 随同上量带来问题复杂化 :随着 PCU、PCC 长期稳固在五位数以上,一般问题曾经能够疾速定位,简单问题开始减少。然而绝对个例问题,客户更加关注全局品质、突发异动以及潜在的隐性问题。
  • 谋求高性价比的服务体验:随着竞品的虎视眈眈以及财务压力,客户冀望能够享受到性价比最高的实时音视频服务。

【服务姿态】

  • 用户行为大数据挖掘为客户决策提供数据撑持 :2020 年 6 月客户频道内观众端数量进步了 600%,然而服务端监控发现视频总体卡顿率也从 1.3% 升高了三倍。与数据团队、产品团队深度单干,从多维度进行问题剖析:

    • 应用 4G 网络的主播和频道内观众:视频卡顿率周期性稳定。国内其余泛娱乐行业用户也有同样法则,海内其余泛娱乐行业用户没有这样的法则;
    • 应用 WIFI 网络的主播和频道内观众:视频卡顿率没有周期性稳定。国内其余泛娱乐行业用户也没有周期性稳定,海内其余泛娱乐行业用户也没有周期性稳定;
    • 2020 年 6 月频道内观众端分钟数比照 5 月进步 6 倍,HD 频道内观众端单日新增 150W 分钟,HD 观众的上行带宽达到 1.8Mbps 比 SD 观众上行带宽减少 3 倍;
    • 2020 年 6 月主播 SD 分钟数升高 50%,升高的分钟数变成主播 HD 分钟数,单日主播 HD 分钟数减少 500W 分钟,HD 主播下行带宽达到 1.2Mbps 比 SD 主播下行带宽减少 3 倍。


2020 年 4 月 - 8 月米连 WIFI/4G 用户视频卡顿率统计


2020 年 4 月 - 8 月米连主播 / 观众分钟数统计


米连最终用户地区散布统计


国内某大型泛娱乐行业客户 4G 用户视频卡顿率呈周期性稳定


海内某大型泛娱乐行业客户 4G 用户视频卡顿率没有周期性稳定

所以初步论断是:2020 年 6 月 11 日开始总体视频卡顿率升高的起因是:频道内观众端用量减少 6 倍,并且 HD 主播和频道内观众单日减少 650W 分钟。其中应用 4G 网络的主播和频道内观众端用户视频卡顿率升高并随日期周期性稳定。导致总体视频卡顿率升高并随日期周期性稳定。4G 用户卡顿率周期性变动的起因通过抽样剖析是用户包月流量用完,导致运营商限速在 1Mbps,导致卡顿率减少。

后续优化指标 & 计划:

  1. 与数据团队深度单干,继续摸索是否还有其余维度能够剖析下卡顿率升高的起因,重点比照 CDN 观众端拉流视频卡顿率是否有同样的稳定,并与后盾评估 MCU 计划对相似问题有多大的缓解和帮忙;
  2. 以目前卡顿率为参照,后续继续优化卡顿率,争取将全网视频卡顿率升高到 1% 以内甚至更低;
  3. 逐步落地升高卡顿率的计划:

    • 短期计划:弱网 Fallback 订阅小流
    • 中期计划:NASA 二期打磨后举荐客户降级 SDK 版本
退出移动版