共计 1904 个字符,预计需要花费 5 分钟才能阅读完成。
作者:金中茜
对石墨文档来说,“用户体验、老本耗费、上线速度”是决定是否在茫茫商海展露头角的重要因素。它须要一套弹性高可用、分布式的服务来实时处理文档编辑抵触:既要保障老本可承受,又要保障在负载突增时平滑解决峰值负载,实现毫秒级别的文档同步响应。
2021 年 7 月 20 日,一场特大暴雨突破了河南的平静,也牵动着全国人民的心。
当晚,大量河南暴雨的信息开始在各类社交媒体急速流传,“待救济人员名单”“救济现场信息”“住宿交通物资信息”…… 一个个在线文档承载着一条条救命信息。石墨文档在第一工夫向抗汛一线的政府部门、医疗机构、公益组织、社会志愿者们提供了收费的高级版产品和服务。
两周内,全国共创立了超过 1600 个灾情协同文档,累积为数百万设施提供了在线协同服务,让抗汛的现场救济、物资运输、医疗及志愿者组织都更加高效。同时,也让石墨文档背地的 IT 零碎面临着微小挑战,尤其是:如何保证系统的安稳运行。
只有零碎安稳的运行,能力让更多人参加到文档合作中,第一工夫对各类救命文档进行整顿、编辑、演绎,让救命信息及时传递进来。
石墨文档禁受住了这次极其流量的考验,背地是五个月前便在阿里云上构建了一套智能运维零碎,买通了零碎全链路可观测数据,实现对立治理,智能告警和提前预检。
灾情一产生,石墨文档团队工程师就接到告警电话,语音主动播报石墨线上 K8S(Kubernetes,容器管控零碎)集群资源使用率飙升,PV(Page View,页面浏览量)同比增加 200% 以上;某些业务接口访问量骤增,多个资源行将达到压力位告警,原来是多个文档的读写次数和拜访人数出现异常增多。
因为短期拜访人数激增,且无奈精确判断后续上涨趋势,工程师疾速协调了数倍于来日的阿里云计算资源对基础设施进行了大规模扩容,确保这些救灾文档在数千人同时合作,数百万人次浏览的状况下也能保持稳定、晦涩的体验,从而保障救灾工作顺利进行。
最终,石墨文档出色完成了作为“信息载体”的工作,文档始终稳固可用。
可能疾速应答极其状况下的流量压力,还有赖于石墨文档始终以来的技术积攒。自 2014 年成立至今,石墨文档累计服务超过 20 万家企业,在 IT 层面次要面临两大挑战。
一是多用户实时合作。为了反对多用户多终端实时在线编写,石墨文档技术团队对 OperationalTransformation 算法进行了十分深刻的摸索和批改,解决了一段文字被多个客户端同时批改所引起的抵触问题。
但这会带来 第二个挑战,就是多用户实时编辑对服务器带来的微小压力。用户敲击键盘输入一个文字只需几毫秒,但如果是大量用户在石墨文档上同时编写文档,就很容易呈现在一个很小时间段内数据分布不均的状况,一个直观的体现就是“写串行”。
对石墨文档来说,“用户体验、老本耗费、上线速度”是决定是否在茫茫商海展露头角的重要因素。它须要一套弹性高可用、分布式的服务来实时处理文档编辑抵触:既要保障老本可承受,又要保障在负载突增时平滑解决峰值负载,实现毫秒级别的文档同步响应。
为此,石墨文档与阿里云进行深度单干,借助公共云 Serverless 架构来应答流量挑战。
函数计算是阿里云提供的 Serverless 服务,依据申请量动态分配执行环境,毫秒级调度计算资源,确保在负载高时保持稳定的延时,在负载低时有着较高的资源利用率,且只会对代码运行时应用的计算资源付费。
石墨文档应用函数计算搭建文档实时编辑服务,由函数计算的智能调度零碎主动调配执行环境,解决多用户同时编写文档带来的峰值负载,函数计算的动静扩缩容能力保障利用的牢靠运行。
借助函数计算毫秒级别的资源伸缩能力,石墨文档解决了高峰期负载突增的计算资源扩容问题,相比于自建机房保护服务器,节俭了 58% 的 IT 老本,目前石墨文档每月调用函数计算超过 30 亿次。
云原生时代,逐步欠缺的 IT 基础设施,让企业能更高效地进行数字化翻新。
因为不必再思考 CPU 密集型计算的负载平衡问题,不仅开发的稳定性进步了,各个我的项目的迭代与上线的步调也快了起来。作为中国第一款反对云端合作的企业办公服务软件,石墨文档实现了以毫秒级同步响应速度,来实现多成员多终端的在线实时合作,弱小稳固的技术撑持着平台高效稳固的服务体验,也正激发更大设想空间。
借助阿里云函数计算极致弹性,石墨文档公布“近程办公版”,为企业带来一系列近程办公模板。这些模板使用方便,实现多人多地在线实时办公。更进一步,12 月 1 日,在“重塑在线办公”的主题下,石墨文档正式推出为企业和组织打造的国产企业级云端 Office——石墨办公,向更广大的市场迈出要害一步。
石墨团队始终围绕企业文档协同的需要不断创新,这为将来的办公协同模式,进行了重要摸索。