关于后端:系统复杂度之高性能

零碎复杂度之【高性能】

明天咱们来谈一谈零碎复杂度的本源之【高性能】

对性能的不懈谋求始终是人类科技继续倒退的外围能源。例如计算机，从电子管计算机到晶体管计算机，再到集成电路计算机，运算性能从每秒几次进步到每秒几亿次。然而，随着性能的晋升，相应的办法和零碎复杂度也逐步减少。古代计算机CPU集成了数亿颗晶体管，其逻辑复杂度和制作难度与最后的晶体管计算机相比，曾经有了天壤之别。

软件系统也呈现出相似的景象。近几十年来，软件系统性能失去了飞速发展，从最后的计算机仅能进行简略科学计算，到现在Google能撑持每秒几万次的搜寻。与此同时，软件系统规模从单台计算机扩大到上万台计算机；从最后的单用户单任务的字符界面DOS操作系统，倒退到当初的多用户多任务的Windows 10图形操作系统。

当然，技术提高带来的性能晋升，并不一定随同着复杂度的增长。例如，硬件存储从纸带、磁带、磁盘倒退到SSD，并未明显增加零碎复杂度。这是因为新技术逐渐淘汰旧技术，咱们能够间接应用新技术，而无需放心零碎复杂度的晋升。只有那些不是用来取代旧技术，而是开辟全新畛域的技术，才会给软件系统带来复杂性，因为软件系统在设计时须要在这些技术之间进行判断、抉择或组合。就像汽车的创造不能取代火车，飞机的呈现也不能齐全代替火车，所以在咱们出行时，须要衡量抉择汽车、火车还是飞机，这个抉择过程绝对简单，波及价格、工夫、速度、舒适度等诸多因素。

软件系统中性能晋升带来的复杂度次要体现在两个方面：一方面是单台计算机外部为实现高性能所产生的复杂度；另一方面是多台计算机集群为实现高性能所引发的复杂度。

单机复杂度

计算机外部复杂度的关键在于操作系统。计算机性能的倒退基本上是由硬件，尤其是CPU性能的倒退所驱动的。驰名的“摩尔定律”预测CPU解决能力每18个月翻一番；而充分发挥硬件性能的要害便是操作系统。因而，操作系统也是随着硬件的倒退而倒退的，作为软件系统的运行环境，操作系统的复杂度间接决定了软件系统的复杂度。

操作系统与性能最相干的便是过程和线程。最早的计算机实际上是没有操作系统的，仅具备输出、计算和输入性能。用户输出一个指令后，计算机实现操作。然而，大部分工夫计算机都在期待用户输出指令，这种解决性能显然是低效的，因为人的输入速度远不迭计算机的运算速度。

为解决手工操作带来的低效，批处理操作系统应运而生。简略来说，批处理是先将要执行的指令事后编写好（写到纸带、磁带、磁盘等），造成一个指令清单，即咱们常说的“工作”。将工作交给计算机执行，批处理操作系统负责读取“工作”中的指令清单并进行解决。这样，计算机执行过程中无需期待人工操作，从而大大提高性能。

只管批处理程序大大晋升了解决性能，但它存在一个显著的毛病：计算机一次只能执行一个工作。如果某个工作须要从I/O设施（例如磁带）读取大量数据，在I/O操作过程中，CPU实际上是闲暇的，而这段闲暇工夫本能够用于其余计算。

为进一步晋升性能，人们创造了“过程”，将一个工作对应到一个过程，每个工作都有本人独立的内存空间，过程间互不相干，由操作系统进行调度。过后的CPU尚无多核和多线程概念，为实现多过程并行运行，采纳了分时形式，行将CPU工夫划分成许多片段，每个片段仅执行某个过程中的指令。只管从操作系统和CPU角度看仍为串行解决，但因为CPU处理速度极快，用户感觉上是多过程并行处理。

多过程要求每个工作都有独立的内存空间，过程间互不相干，但从用户角度看，若两个工作在运行过程中可能通信，则工作设计会更加灵便高效。为解决这个问题，各种过程间通信形式应运而生，包含管道、音讯队列、信号量、共享存储等。

多过程使多任务可能并行处理，但仍存在缺点，单个过程外部仅能串行解决。实际上，许多过程外部的子工作并不要求严格按工夫程序执行，也须要并行处理。例如，一个餐馆治理过程，排位、点菜、买单、服务员调度等子工作必须并行处理，否则可能呈现因某客人买单工夫较长（如信用卡刷不进去）而导致其余客人无奈点菜的状况。为解决这一问题，人们创造了线程，线程是过程外部的子工作，但这些子工作共享同一份过程数据。为保证数据的正确性，又创造了互斥锁机制。有了多线程后，操作系统调度的最小单位变成了线程，而过程则成为操作系统分配资源的最小单位。

只管多过程多线程让多任务并行处理的性能大大晋升，但实质上仍为分时系统，无奈实现工夫上真正的并行。解决这一问题的办法是让多个CPU同时执行计算工作，从而实现真正意义上的多任务并行。目前这样的解决方案有三种：SMP（对称多处理器构造）、NUMA（非统一存储拜访构造）和MPP（海量并行处理构造）。其中，SMP是咱们最常见的，以后风行的多核处理器即采纳SMP计划。

现在的操作系统倒退曾经相当成熟，若要实现一个高性能的软件系统，须要思考多过程、多线程、过程间通信、多线程并发等技术点。然而，这些技术并非最新的就是最好的，也不是非此即彼的抉择。在进行架构设计时，须要投入大量精力来联合业务进行剖析、判断、抉择和组合，这一过程同样颇为简单。举一个简略的例子：Nginx能够采纳多过程或多线程，JBoss则采纳多线程；Redis采纳单过程，而Memcache则采纳多线程，只管这些零碎都实现了高性能，但其外部实现却天壤之别。

集群的复杂度

只管计算机硬件性能迅速倒退，但与业务倒退速度相比，仍显得力不从心，特地是进入互联网时代后，业务倒退速度远超硬件倒退速度。例如：

2016年“双11”支付宝每秒峰值达到12万笔领取。
2017年春节微信红包收发红包每秒达到76万个。

要反对如领取和红包等简单业务，单机性能无论如何都无奈撑持。因而，必须采纳机器集群的形式来实现高性能。例如，支付宝和微信这类规模的业务零碎，后盾零碎的机器数量均达到了万台级别。

通过大量机器晋升性能，并非仅仅是减少机器那么简略。让多台机器协同实现高性能工作是一项简单的工作。以下针对常见的几种形式进行简要剖析：

1.任务分配

任务分配意味着每台机器都能解决残缺的业务工作，将不同任务分配给不同机器执行。为实现无效的任务分配，负载平衡技术应运而生。负载平衡能够通过硬件或软件实现，其指标是将工作平均分配到各个机器上，确保系统资源失去充分利用，从而进步整体性能。

2.数据分片

数据分片是指将数据切分成多个局部，每个局部调配到一个或多个机器上。这种形式能够实现数据的程度扩大，进步数据处理能力。例如，数据库分片技术能够将一个大型数据库宰割成多个小型数据库，每个小型数据库承当局部数据处理工作。

3.数据正本

为进步数据可靠性和可用性，可在多台机器上创立数据的正本。当一台机器呈现故障时，其余具备数据正本的机器能够立刻接管服务，确保业务不间断。数据正本技术在分布式存储系统中尤为重要，如分布式文件系统、分布式数据库等。

4.工作并行

工作并行是指将一个大工作分解成多个小工作，并在多台机器上同时执行。这种形式能够显著缩小工作执行工夫，进步解决能力。例如，MapReduce是一种驰名的工作并行计算模型，能够将大数据处理工作分解成多个小工作，在集群中并行执行，最初将后果汇总输入。

总之，集群技术为应答业务需要提供了弱小的反对，但实现高性能集群须要思考任务分配、数据分片、数据正本、工作并行等多种技术，并依据具体业务需要进行正当抉择和组合。随着云计算的遍及，集群技术将更加成熟，将来亦可期待更多翻新和倒退。

我从最简略的一台服务器变两台服务器开始，来讲任务分配带来的复杂性，整体架构示意图如下。

从图中能够看到，1台服务器演变为2台服务器后，架构上显著要简单多了，次要体现在：

须要减少一个工作分配器，这个分配器可能是硬件网络设备（例如，F5、交换机等），可能是软件网络设备（例如，LVS），也可能是负载平衡软件（例如，Nginx、HAProxy），还可能是本人开发的零碎。抉择适合的工作分配器也是一件简单的事件，须要综合思考性能、老本、可维护性、可用性等各方面的因素。
工作分配器和真正的业务服务器之间有连贯和交互（即图中工作分配器到业务服务器的连接线），须要抉择适合的连贯形式，并且对连贯进行治理。例如，连贯建设、连贯检测、连贯中断后如何解决等。
工作分配器须要减少调配算法。例如，是采纳轮询算法，还是按权重调配，又或者依照负载进行调配。如果依照服务器的负载进行调配，则业务服务器还要可能上报本人的状态给工作分配器。

这一大段形容，即便你可能还看不懂，但也应该感触到其中的复杂度了，更何况还要真正去实际和实现。

下面这个架构只是最简略地减少1台业务机器，咱们假如单台业务服务器每秒可能解决5000次业务申请，那么这个架构实践上可能撑持10000次申请，实际上的性能个别依照8折计算，大概是8000次左右。

如果咱们的性能要求持续进步，假如要求每秒晋升到10万次，下面这个架构会呈现什么问题呢？是不是将业务服务器减少到25台就能够了呢？显然不是，因为随着性能的减少，工作分配器自身又会成为性能瓶颈，当业务申请达到每秒10万次的时候，单台工作分配器也不够用了，工作分配器自身也须要扩大为多台机器，这时的架构又调演变成这个样子。

这个架构比2台业务服务器的架构要简单，次要体现在：

工作分配器从1台变成了多台（对应图中的工作分配器1到工作分配器M），这个变动带来的复杂度就是须要将不同的用户调配到不同的工作分配器上（即图中的虚线“用户调配”局部），常见的办法包含DNS轮询、智能DNS、CDN（Content Delivery Network，内容散发网络）、GSLB设施（Global Server Load Balance，全局负载平衡）等。
工作分配器和业务服务器的连贯从简略的“1对多”（1台工作分配器连贯多台业务服务器）变成了“多对多”（多台工作分配器连贯多台业务服务器）的网状结构。
机器数量从3台扩大到30台（个别工作分配器数量比业务服务器要少，这里咱们假如业务服务器为25台，工作分配器为5台），状态治理、故障解决复杂度也大大增加。

下面这两个例子都是以业务解决为例，实际上“工作”涵盖的范畴很广， 能够指残缺的业务解决，也能够单指某个具体的工作。例如，“存储”“运算”“缓存”等都能够作为一项工作，因而存储系统、运算零碎、缓存零碎都能够依照任务分配的形式来搭建架构。此外，“工作分配器”也并不一定只能是物理上存在的机器或者一个独立运行的程序，也能够是嵌入在其余程序中的算法，例如Memcache的集群架构。

2.工作合成

通过任务分配的形式，咱们可能冲破单台机器解决性能的瓶颈，通过减少更多的机器来满足业务的性能需求，但如果业务自身也越来越简单，单纯只通过任务分配的形式来扩大性能，收益会越来越低。例如，业务简略的时候1台机器扩大到10台机器，性能可能晋升8倍（须要扣除机器群带来的局部性能损耗，因而无奈达到实践上的10倍那么高），但如果业务越来越简单，1台机器扩大到10台，性能可能只能晋升5倍。造成这种景象的次要起因是业务越来越简单，单台机器解决的性能会越来越低。为了可能持续晋升性能，咱们须要采取第二种形式： 工作合成。

持续以下面“任务分配”中的架构为例，“业务服务器”如果越来越简单，咱们能够将其拆分为更多的组成部分，我以微信的后盾架构为例。

通过下面的架构示意图能够看出，微信后盾架构从逻辑上将各个子业务进行了拆分，包含：接入、注册登录、音讯、LBS、摇一摇、漂流瓶、其余业务（聊天、视频、朋友圈等）。

通过这种工作合成的形式，可能把原来大一统但简单的业务零碎，拆分成小而简略但须要多个零碎配合的业务零碎。从业务的角度来看，工作合成既不会缩小性能，也不会缩小代码量（事实上代码量可能还会减少，因为从代码外部调用改为通过服务器之间的接口调用），那为何通过工作合成就可能晋升性能呢？

次要有几方面的因素：

简略的零碎更加容易做到高性能

零碎的性能越简略，影响性能的点就越少，就更加容易进行有针对性的优化。而零碎很简单的状况下，首先是比拟难以找到要害性能点，因为须要思考和验证的点太多；其次是即便破费很大力量找到了，批改起来也不容易，因为可能将A要害性能点晋升了，但却无心中将B点的性能升高了，整个零碎的性能岂但没有晋升，还有可能会降落。

能够针对单个工作进行扩大

当各个逻辑工作合成到独立的子系统后，整个零碎的性能瓶颈更加容易发现，而且发现后只须要针对有瓶颈的子系统进行性能优化或者晋升，不须要改变整个零碎，危险会小很多。以微信的后盾架构为例，如果用户数增长太快，注册登录子系统性能呈现瓶颈的时候，只须要优化登录注册子系统的性能（能够是代码优化，也能够简略粗犷地加机器），音讯逻辑、LBS逻辑等其余子系统齐全不须要改变。

既然将一个大一统的零碎合成为多个子系统可能晋升性能，那是不是划分得越细越好呢？例如，下面的微信后盾目前是7个逻辑子系统，如果咱们把这7个逻辑子系统再细分，划分为100个逻辑子系统，性能是不是会更高呢？

其实不然，这样做性能不仅不会晋升，反而还会降落，最次要的起因是如果零碎拆分得太细，为了实现某个业务，零碎间的调用次数会呈指数级别回升，而零碎间的调用通道目前都是通过网络传输的形式，性能远比零碎内的函数调用要低得多。我以一个简略的图示来阐明。

从图中可见，当零碎拆分为2个子系统时，用户拜访须要1次零碎间申请和1次响应；当零碎拆分为4个子系统时，零碎间申请次数从1次减少到3次；若持续拆分为100个子系统，为实现某次用户拜访，零碎间申请次数将达到99次。

为简化形容，咱们形象出一个最简模型：假如这些零碎通过IP网络连接，在现实状况下，一次申请和响应在网络上耗时为1ms，业务解决自身耗时为50ms。咱们还假如零碎拆分对单个业务申请性能没有影响。因而，当零碎拆分为2个子系统时，解决一次用户拜访耗时为51ms；而零碎拆分为100个子系统时，解决一次用户拜访耗时居然达到了149ms。

只管在肯定水平上，零碎拆分有助于晋升业务解决性能，但性能晋升是无限的。当零碎未拆分时，业务解决耗时为50ms，零碎拆分后业务解决耗时不可能仅为1ms。因为业务解决性能依然受限于业务逻辑自身，而在业务逻辑没有产生重大变动的状况下，实践上性能具备一个下限。零碎拆分能够让性能靠近这一极限，但无奈冲破它。因而，工作合成所带来的性能收益具备肯定的度，工作合成不是越细越好。对于架构设计而言，如何把握这一粒度便显得至关重要。

小结

明天我给你讲了软件系统中高性能带来的复杂度次要体现的两方面，一是单台计算机外部为了高性能带来的复杂度；二是多台计算机集群为了高性能带来的复杂度，心愿对你有所帮忙。

本文由mdnice多平台公布

关于后端:系统复杂度之高性能

零碎复杂度之【高性能】

单机复杂度

集群的复杂度

小结

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于后端:系统复杂度之高性能

零碎复杂度之【高性能】

单机复杂度

集群的复杂度

小结

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复