关于tidb:TiDB-x-中通科技-提效-300TiDB-联手中通让你的包裹实时可见

「咱们曾经用起来了」，是咱们最喜爱听到的话，简简单单几个字的背地代表着沉甸甸的信赖和托付。从明天开始，咱们将通过 「置信凋谢的力量」 系列深度案例分享，从业务的角度，看看一个数据库为各行业用户带来的业务价值。本篇文章将介绍 TiDB 联手中通科技打造全场景全链路数字化平台服务的故事。

洞悉包裹的每一段旅程
不负身边的每一份守候

下单秒杀，到收货开箱，置信大多数人对于“双十一”这个非凡期间的快递物流体验相当相熟。从下单后的『望穿秋水』到包裹的『全流程追踪』，最近几年，快递再不是以前“肩扛手提的黑盒子”，电子面单、自动化分拣、智能机器人、全链路数字追踪等数字化技术的加持下，快递业正在酝酿一场能够预感的全新变质。

中通快递成立于 2002 年，通过十余年的倒退，目前整体业务规模达到了世界第一，也是第一个达成年百亿业务量的快递企业，去年的双十一更是实现了订单量超过 2 亿的佳绩。中通科技是中通快递旗下的互联网物流科技平台，领有一支千余人规模的研发团队，秉承着“互联网 + 物流”的理念，与公司的策略、业务严密的连接，为中通生态圈的业务打造全场景全链路的数字化平台服务。

快递的生命周期简略的介绍能够分为五个字，收发到派签。

整个物流的全链路中依照这样的流程会拆解成多个要害节点，在每个要害节点会产生大量的数据，对每个要害节点每一个数据快递公司都会进行相干的剖析，包含时效的监控（比方快递的流程跟踪、快递在快递收发点停留时间等等）。原来的架构大量的数据统计分析依赖于在 Oracle 上建好多存储过程，但随着数据量越来越大，存储和计算的问题越来越显著，单纯靠降级 Oracle 的硬件无奈从根本上解决问题，并且随着硬件的一直降级，老本也越来越高。

近几年，快递行业的业务量突飞猛进，随着业务倒退带来的数据量激增，中通遇到了以下问题：

寄存在 Oracle Exadata 一体机数据周期越来越短，分库分表的设计满足不了时效需统计分析依赖存储过程，零碎的扩展性和可维护性不高。
业务顶峰期间单机遇到性能瓶颈，故障危险较高，数据同步 T+1 的剖析时效不够。
如何升高 TCO。
业务倒退快、数据量激增，能寄存在 Exadata 一体机数据周期越来越短，业务方对数据周期需要回升。
业务顶峰单机性能瓶颈，单点故障危险高，数据同步 T+1，剖析时效不够。
测试 HBase、Kudu 建设实时数仓，和现有技术栈难以兼容，并且不能很好撑持业务端多维度的 query。

面对这些需要，中通快递新构建的 IT 零碎除了要兼容过来的 IT 架构，更要具备敏捷性，要可能更快响应业务倒退的需要，并且还能更好地推动将来业务的倒退。在要害业务上的反对上，底层的数据库须要满足强统一分布式事务，反对高并发读写，提供灵便的在线扩大能力，并且能够与 Spark 技术生态严密交融，反对大宽表的建设，反对多维度的查问剖析。

依据中通理论业务状况和技术痛点，构建了 TiDB 数据库集群，实现了多个利用零碎生产数据的实时写入，借助 TiSpark 实现了数据实时剖析，汇总数据，同时下层利用提供了标准化的 API 接口，给业务经营人员和快递人员提供了灵便的查问界面，满足了实时、便捷、精确的查问服务申请，抉择 TiDB 具体起因如下：

TiDB 反对在线扩大，数据按 Region 分片，有自带的调度治理组件，进行热点的调度和数据分布。
强统一的 ACID 分布式事务、二级索引。
能高并发写和更新，并且反对疾速响应业务方的需要、进行查问后果。
技术生态与 Spark 紧密结合，反对用 Spark 疾速的做分钟级统计分析。
反对大宽表的建设，反对多维度的查问剖析。

用户通过平台客户端下单后，产生惟一的快递单号作为惟一身份标识。快递除了订单号，还会有很多属性信息，如：邮寄人、邮寄人手机、邮寄人地址、收件人、快递类型等信息。生成快递订单后，用户的邮寄物品才会成为“快递”。

当快递收回后，快递员从收件、扫码、转运等快递的流转事件、地点、工夫信息都将会不定期推送至零碎。快递流转信息不仅能够是简略的量化数据，也能够是描述性文字、地理位置等非凡信息。零碎须要将流转信息记录成快递的监控数据，同时批改快递状态、实时地位等，从而实现包裹的『全流程追踪』。

在中通快递传统的 IT 体系架构里，大量的数据统计分析依赖于 Oracle，但随着数据量越来越大，存储和计算的问题越来越显著，单纯靠降级 Oracle 的硬件无奈从根本上解决问题，并且随着硬件的一直降级，老本也越来越高。

上图是中通快递整个零碎重构后的架构：

右边是来自各个环节的音讯接入，通过 Spark 实时计算把这些音讯接进来，与 Hive 维表在分布式计算外面做一些 Merge 和 JOIN。
同时会跟离线 T+1 的计算剖析进去的数据、存在 HBase 的数据做 Merge 的计算。
最终计算的后果咱们会把它存到 TiDB 外面。每天会定时和 TiDB 做一次同步，把 TiDB 的数据同步到 Hive，做一个数据备份。
依赖 TiSpark 在 TiDB 上做数据的统计分析，通常称为汇总层，汇总层包含公共数据和业务层数据，咱们也会把这些数据放在 Oracle 外面一份，包含轻度汇总和多维汇总。
基于 TiDB 去提供明细的服务，像 API 接口的服务、明细查问和一些标签。

从新的架构上看，每一个要害的节点都反对可横向扩大，解决了单点问题，同时升高了根底的 IT 老本。

对于物流企业来说，升高企业物流老本始终是行业挑战，中通快递也在一直地从模式翻新上、从全链路优化上、乃至物流的各个环节去提高效率、降低成本。

咱们在日常收快递过程中，通常能够看到相似这样的信息：”快递曾经到 XXXX 转运核心”、”快递曾经达到 XXXX 集散中心”，这种在工厂仓库到配送起点之间，设置直达仓的模式被称为“二次配送”。

其原理就是通过大数据平台，联合仓库地址、物资需求量、车辆运载量、配送次数等数据，进行剖析和计算，优化配送路线、正当抉择物流核心地址、优化仓库储位，从而升高物流老本，进步物流效率。在中通快递整个快件派送的物流链路过程中，在各个转运环节都会有很多音讯的接入，须要针对每一单快件进行全链路路由和时效的预测，定位到每一票快件转运环节，整个过程不仅数据量微小，并且对时效性要求很高。

如上图所示，中通快递基于 TiDB 进行实时数仓宽表的建设，业务的 OLTP 数据通过 TiDB 实时写入，后续 OLAP 的业务通过 TiSpark 做分钟级的剖析。通过业务实测，TiSpark 同步 3 亿条数据到 Hive 大略须要 10 分钟，为中通快递的实时数仓建设与离线 T+1 的整合提供保障，无效撑持全链路的时效剖析与监控，能够准实时地定位每一票快件在每一个环节的状态。据理解，通过二次配送，在发达且密集城市，均匀为企业节俭 25% 的每包裹配送费用。

信息化智能化的浪潮已成大势，技术与业务齐头并进，能力让快递行业取得将来竞争力。

中通快递 2019 全年实现业务量 121.2 亿件，同比增长 42.2%，超出行业均匀增速 16.9 个百分点。在过来的 2019 年双十一大促中，TiDB 同时撑持线上 OLTP 和 OLAP 的业务，QPS 峰值在 12 万 +，反对百亿级的插入和更新，TiSpark 反对业务在线的分钟级统计分析，完满保障了双十一中通快递 IT 服务的稳固运行。除此之外，基于 TiDB 构建的新一代数据库基础设施还带来以下收益：

解决单点问题，整体架构清晰，可维护性加强，零碎扩展性加强。
满足高性能 OLTP 业务需要，反对在线横向扩大，随时高低线存储和计算节点，利用无感知。
数据存储周期从 15 天反对到 45 天。
OLTP 和 OLAP 拆散，反对更多业务维度的剖析。

面对强烈的竞争态势，中通快递通过技术创新，以 TiDB 为数据底座对业务零碎进行一个从新的架构降级，目前中通快递有超过 100 个物理节点，200 余个实例的 TiDB 投入生产应用，次要服务账单、结算核心、订单核心、运单核心、音讯核心、转运智能相干产品线，取得收益如下：

数据驱动的精细化治理措施继续施展效益，2020 年二季度，单票老本同比降落 17.1%。
TiDB 灵便高效、按需扩大的部署计划，相较之前 Oracle，显著升高 TCO。

每次数据库架构改善与落地，无论是 TB 级还是 PB 级，都须要付出致力，但这也值得每一个企业去实际。在当下这个时代，不论企业的规模如何，都要学会借助开源的力量，防止去反复的造轮子。

每一个看似轻松的背地都有鲜为人知的致力，每一个看似光鲜亮丽的背地，都有鲜为人知的付出。分布式数据库建设之路道阻且长，TiDB 愿与中通科技及每个客户一起，携手并肩把事件做好。

关于tidb:TiDB-x-中通科技-提效-300TiDB-联手中通让你的包裹实时可见

业务挑战

Why TiDB

解决方案

订单 & 运单核心

二次配送：数字化重塑配送全流程

用户收益

增效：IT 反对效率晋升 300%

降本：数据驱动精细化经营，老本同比升高 17.1%

与客户同行，置信凋谢的力量