关于后端:一文搞懂秒杀系统欢迎参与开源提交PR提高竞争力早日上岸升职加薪

秒杀和高并发是面试的高频考点，也是咱们做电商我的项目必知必会的场景。欢送大家参加咱们的开源我的项目，提交 PR，进步竞争力。早日上岸，升职加薪。

这篇文章一万多字，具体解答了大家在面试中常常被问到的秒杀问题，对做秒杀我的项目的敌人也应该有帮忙。

欢送大家交换探讨、点赞、珍藏、转发。

本文除了联合我的我的项目教训、也感激 GoFrame 作者强哥的帮忙、我的好友苏三哥的帮忙（公众号：苏三说技术）、以及机械工业出版社的《Go 语言高级开发与实战》 的帮忙。

文章中的图片会压缩，高清版思维导图能够关注我的公众号程序员升职加薪之旅，回复：“秒杀”支付。

刹时高并发是秒杀我的项目的典型问题，惯例的架构设计和代码实现在个别流动中能够应答，然而却禁受不住刹时高并发的考验。

这也是为什么秒杀能成为一个面试高频考点。

本文从浅入深，先将业务再讲原理，先讲问题再将计划，先讲实践再上代码。

也欢送大家退出我的学习圈子，参加到我应用 GoFrame 开源的电商我的项目中，欢送 star：

https://github.com/wangzhongy…

https://github.com/gogf/gf

预抢购业务：流动未正式开始前，先进行流动预约。在真正秒杀的工夫点，很多数据都是预处理好的了，能够很大水平削减零碎压力。比方：流动预约、订金预约、火车票预约等
分批抢购业务：分时段多场次抢购，比方咱们相熟的京东满减优惠券就是分场次凋谢的，整点抢购。
实时秒杀：这是最有难度的秒杀场景，比方双 11 早晨 0 点秒杀，在这个工夫点前后会涌入高并发流量：频繁刷新页面、疯狂点击抢购按钮、甚至利用机器模仿申请。

上面就依照思维导图的程序，为大家开展聊聊 如何做好秒杀零碎的设计？

流动页面是用户流量的第一入口，是并发量最大的中央。

如果这些流量都间接拜访服务端，服务端会因为承受不住这么大的压力，而间接挂掉。

流动页面绝大多数内容是固定的，比方：商品名称、商品形容、图片等。

为了缩小不必要的服务端申请，通常状况下，会对流动页面做动态化解决。

因为用户浏览商品等惯例操作，并不会申请到服务端。只有到了秒杀工夫点，并且用户被动点了秒杀按钮才容许拜访服务端。

更进一步，只做页面动态化还不够，因为用户散布在全国各地，有些人在北京，有些人在上海，有些人在深圳，地区相差很远，网速各不相同。

如何能力让用户最快拜访到流动页面呢？

这就须要应用 CDN，它的 全称是 Content Delivery Network，即内容散发网络。

使用户可能就近获取所需内容，进步用户拜访流动页面的响应速度和命中率。

如果你也参加过秒杀流动，应该有这样的领会：因为放心错过秒杀工夫，会提前进入流动页面，并且一直的刷新页面。

很多秒杀流动在流动开始前，秒杀按钮是置灰，不可点击的。只有到了秒杀工夫点那一时刻，秒杀按钮才会主动点亮，变成可点击的。

往往在秒杀开始之前，很多用户曾经急不可待了，通过不停刷新页面，争取在第一工夫看到秒杀按钮的点亮。

大家思考一个问题：这个流动页面是动态的，咱们在动态页面中如何管制秒杀按钮，只在秒杀工夫点时才点亮呢？

答案就是：应用 js 文件管制。

为了性能思考，咱们个别会将 css、js 和图片等动态资源文件提前缓存到 CDN 上，让用户可能就近拜访秒杀页面。

咱们还要思考一个问题：CDN 上的 js 文件要如何更新呢？

咱们能够通过在 js 中设置标记的形式来设置按钮的状态，比方 isBegin=true 代表流动开始，isBegin=false 代表流动未开始。

秒杀开始之前，js 标记为 false，秒杀流动开始时设置为 true。为了达到这个成果，咱们另外还须要一个随机参数用来被动刷新 CDN。

当秒杀开始的时候零碎会生成一个新的 js 文件，此时标记为 true，并且随机参数生成一个新值，而后同步给 CDN。因为有了这个随机参数，CDN 不会缓存数据，每次都能从 CDN 中获取最新的 js 代码。

除了应用 CDN 升高申请压力，前端还能够加一个定时器，管制申请频率，比方：10 秒之内，只容许发动一次申请。

如果用户点击了一次秒杀按钮，则在 10 秒之内置灰，不容许再次点击，等到过了工夫限度，又容许从新点击该按钮。

秒杀是十分典型的“读多写少”场景。

在秒杀的过程中，零碎个别会先查一下库存是否足够，如果库存短缺才容许下单，写数据库。如果不够，则间接返回该商品曾经抢完。

因为大量用户抢大量商品，只有极少局部用户可能抢胜利，所以绝大部分用户在秒杀时，库存其实是有余的，零碎会间接返回该商品曾经抢完。

如果有数十万的申请过去，并发申请数据库查库存是否足够，此时数据库可能会挂掉。

因为数据库的连贯资源十分无限，MySQL 这类关系型数据库是无奈同时反对这么多的连贯。

那怎么办呢？

咱们应该应用 nosql 缓存，比方：redis。

留神：即使用了 redis，在高并发场景下也须要部署多个节点。

通常状况下，咱们须要在 redis 中保留商品信息，包含：商品 id、商品名称、规格属性、库存等信息，同时数据库中也要有相干信息，毕竟缓存并不齐全牢靠。

用户在点击秒杀按钮，申请秒杀接口的过程中，传入的商品 id 参数，服务端须要校验该商品是否非法。

大抵流程如下图所示：

依据商品 id，先从缓存中查问商品，如果商品存在，则参加秒杀。
如果不存在，则须要从数据库中查问商品：
如果存在，则将商品信息放入缓存，而后参加秒杀。
如果商品不存在，则间接提醒失败。

这个过程外表上看起来是 OK 的，然而如果深入分析，会发现一些问题。

为了不便大家了解，也科普一下缓存罕用问题：

比方商品 A 第一次秒杀时，缓存中是没有数据的，但数据库中有。虽说下面有从数据库中查到数据，放入缓存的逻辑。

然而在高并发下，同一时刻会有大量的申请，都在秒杀同一件商品，这些申请同时去查缓存没有命中，而后又同时拜访数据库。后果喜剧了，数据库可能扛不住压力，间接挂掉。

如何解决这个问题呢？

这就须要加锁，最好应用 分布式锁，思路见下图：

针对这种状况，咱们最好在我的项目启动之前，先把缓存进行预热。

当时把参加秒杀的所有商品，同步到缓存中，这样商品根本都能间接从缓存中获取到，就不会呈现缓存击穿的问题了。

是不是下面加锁这一步能够不须要了？

外表上看起来，的确能够不须要。然而实在环境是比较复杂的，咱们要思考到意外状况，比方：

缓存中设置的过期工夫不对，缓存提前过期了
或者缓存被不小心删除了
或者缓存设置的工夫过短，在秒杀流动完结前同时到期了

如果不加锁，下面这些状况很可能呈现缓存击穿的问题。

流动数据预缓存 + 分布式锁，相当于上了双保险。

如果有大量的申请传入商品 id，并且在缓存和数据库中都不存在，这些申请就都会穿透过缓存，而间接拜访数据库了。这就是典型的 缓存穿透。

如果没有加锁的话很可能造成服务不可用。

因为后面曾经加了锁，所以即便这里的并发量很大，也不会导致数据库间接挂掉。但很显然这些申请的解决性能并不好。

有没有更好的解决方案？

布隆过滤器 你值得领有

简略来说，布隆过滤器（BloomFilter）是一种数据结构。特点是 存在性检测 ， 如果布隆过滤器中不存在，那么理论数据肯定不存在；如果布隆过滤器中存在，理论数据不肯定存在。相比于传统数据结构（如：List、Set、Map 等）来说，它更高效，占用空间更少。毛病是它对于存在的判断是具备概率性。

引入布隆过滤器后的流程如下：

零碎依据商品 id，先从布隆过滤器中查问该 id 是否存在
如果存在则容许从缓存中查问数据
如果不存在，则间接返回失败。

虽说该计划能够解决缓存穿透问题，然而又会引出另外一个问题：布隆过滤器中的数据如何跟缓存中的数据保持一致？

这就要求，如果缓存中数据有更新，就要及时同步到布隆过滤器中。

如果数据同步失败了，还须要减少重试机制，而且跨数据源，能保证数据的实时一致性吗？

显然是不能的。

布隆过滤器倡议应用在缓存数据更新很少的场景中。

如果缓存数据更新十分频繁，又该如何解决呢？

咱们能够把不存在的商品 id 也缓存起来。

下次，再有该商品 id 的申请过去，则也能从缓存中查到数据，只不过该数据比拟非凡，示意商品不存在。 须要特地留神的是，这种非凡缓存设置的超时工夫应该尽量短一点。

秒杀场景中的库存问题是比较复杂的，可不是简略的库存减 1 就 ok 了~

真正的秒杀场景，不是说扣完库存，就完事了。如果用户在一段时间内，还没实现领取，扣减的库存是要加回去的。

在这里为大家介绍 预扣库存 的概念，预扣库存的次要流程如下：

扣减库存中除了下面说到的 预扣库存 和 回退库存 之外，还须要特地留神的是 库存有余 和 库存超卖 问题。

上面一一为大家解释：

应用数据库扣减库存，是最简略的实现计划了，假如扣减库存的 update sql 如下：

update product set stock=stock-1 where id=123;

这种写法对于扣减库存是没有问题的，但如何管制库存有余的状况下，不让用户操作呢？

这就须要在 update 之前，先查一下库存是否足够了。

伪代码如下：

int stock = product.getStockById(123);
if(stock > 0) {int count = product.updateStock(123);
  if(count > 0) {addOrder(123);
  }
}

大家有没有发现这段代码的问题？

问题就是 查问操作和更新操作不是原子性的，会导致在并发的场景下，呈现库存超卖的状况。

有些同学可能会说：这简略，加把锁不就搞定了。

的确能够，然而性能不够好，咱们做秒杀肯定要思考高并发，思考到性能问题。

优雅的解决计划：基于数据库的乐观锁，这样会少一次数据库查问，而且可能人造的保证数据操作的原子性。

只需将下面的 sql 略微调整一下：

update product set stock=stock-1 where id=product_id and stock > 0;

在 sql 最初加上：stock > 0，就能保障不会呈现超卖的状况。

咱们都晓得数据库连贯是十分低廉的资源，在高并发的场景下，可能会造成零碎雪崩。而且，容易呈现多个申请，同时竞争行锁的状况，造成互相期待，从而呈现死锁的问题。

除了上述计划有没有更好的方法呢？

当然有了，nosql 要比关系型数据库性能好很多，咱们能够应用 redis 扣减库存：

redis 的 incr 办法是原子性的，能够用该办法扣减库存。伪代码如下：

boolean exist = redisClient.query(productId,userId);
  if(exist) {return -1;}

  int stock = redisClient.queryStock(productId);
  if(stock <=0) {return 0;}
  
  redisClient.incrby(productId, -1);
  redisClient.add(productId,userId);
  return 1;

代码流程如下：

先判断该用户有没有秒杀过该商品，如果曾经秒杀过，则间接返回 -1。
查问库存，如果库存小于等于 0，则间接返回 0，示意库存有余。
如果库存短缺，则扣减库存，而后将本次秒杀记录保存起来。而后返回 1，示意胜利。

预计很多小伙伴，一开始都会按这样的思路写代码。

但认真想想会发现，这段代码也有问题。有什么问题呢？

如果在高并发下，有多个申请同时查问库存，过后都大于 0。因为查问库存和更新库存非准则操作，则会呈现库存为正数的状况，即库存超卖。

其实解决这个问题也很简略，咱们回顾一下下面数据库扣减库存的原子操作，redis 扣减库存同样实用这个思路，为了解决下面的问题，代码优化如下：

boolean exist = redisClient.queryJoined(productId,userId);
if(exist) {return -1;}
if(redisClient.incrby(productId, -1)<0) {return 0;}
redisClient.add(productId,userId);
return 1;

该代码次要流程如下：

先判断该用户有没有秒杀过该商品，如果曾经秒杀过，则间接返回 -1。
扣减库存，判断返回值是否小于 0，如果小于 0，则间接返回 0，示意库存有余。
如果扣减库存后，返回值大于或等于 0，则将本次秒杀记录保存起来。而后返回 1，示意胜利。

这个计划曾经比拟优雅了，然而还不够好。

如果在高并发场景中，有多个申请同时扣减库存，大多数申请的 incrby 操作之后，后果都会小于 0。

虽说，库存呈现正数，不会呈现超卖的问题。但因为这里是预减库存，如果负数值负的太多的话，前面万一要回退库存时，就会导致库存不准。

那么，有没有更好的计划呢？

Redis 在 2.6 版本推出了 Lua 脚本性能，容许开发者应用 Lua 语言编写脚本传到 Redis 中执行。

应用 Lua 脚本的益处如下:

缩小网络开销：能够将多个申请通过脚本的模式一次发送，缩小网络时延
原子操作：redis 会将整个脚本作为一个整体执行，两头不会被其余申请插入。因而在脚本执行过程中无需放心会呈现竞态条件，无需应用事务
复用：客户端发送的脚本会永恒存在 redis 中，这样其余客户端能够复用这一脚本，而不须要应用代码实现雷同的逻辑

Go 语言要执行 lua 脚本也是很简略的，有很多依赖库能够应用：

上述 lua 代码的流程如下：

先判断商品 id 是否存在，如果不存在则间接返回。
获取该商品 id 的库存，判断库存如果是 -1，则间接返回，示意不限度库存。
如果库存大于 0，则扣减库存。
如果库存等于 0，是间接返回，示意库存有余。

上文咱们提到过，秒杀的数据获取流程：

须要先从缓存中查商品是否存在
如果不存在，则会从数据库中查商品
如果数据库存在，则将该商品放入缓存中，而后返回
如果数据库中没有，则间接返回失败。

大家试想一下，如果在高并发下，有大量的申请都去查一个缓存中不存在的商品，这些申请都会间接打到数据库。数据库因为承受不住压力，而间接挂掉。

那么如何解决这个问题呢？

这就须要用 redis 分布式锁了。

上面带着大家详解一下分布式锁

应用 redis 的分布式锁，首先想到的是 setNx 命令。

Redis Setnx（SET if Not eXists）命令在指定的 key 不存在时，为 key 设置指定的值。

if (redis.setnx(lockKey, val) == 1) {redis.expire(lockKey, timeout);
}

用该命令能够加锁，但和前面的设置超时工夫是离开的，并非原子操作。

如果加锁胜利了，然而设置超时工夫失败了，该 lockKey 就变成永不生效的了。在高并发场景中，该问题会导致十分重大的结果。

那么，有没有保障原子性的加锁命令呢？

应用 redis 的 set 命令，它能够指定多个参数。

result,err := redis.set(lockKey, requestId, "NX", "PX", expireTime);
if err!=nil{panic(err)
}
if ("OK".equals(result)) {return true;}
return false;

其中：

lockKey：锁的标识
requestId：申请 id
NX：只在键不存在时，才对键进行设置操作。
PX：设置键的过期工夫为 millisecond 毫秒。
expireTime：过期工夫

因为该命令只有一步，所以它是原子操作。

仔细的小伙伴可能留神到了一个问题：在加锁时，既然曾经有了 lockKey 锁标识，为什么还须要记录 requestId 呢？

答：requestId 是在开释锁的时候用的。

if (redis.get(lockKey).equals(requestId)) {redis.del(lockKey);
    return true;
}
return false;

在开释锁的时候，只能开释本次申请加的锁，不容许开释其余申请加的锁。

这里为什么要用 requestId，用 userId 不行吗？

如果用 userId 的话，假如本次申请流程走完了，筹备删除锁。此时，偶合另外一个申请应用雷同的 userId 加锁胜利。而本次申请删除锁的时候，删除的其实是本应该加锁胜利的锁（新的申请的锁），所以不咱们不能以 userId 为加锁标识，而应该用每次的 requestId 为加锁标识。

当然应用 lua 脚本也能防止该问题，它能保障原子操作：查问锁是否存在和删除锁 具备原子性。

if redis.call('get', KEYS[1]) == ARGV[1] then 
 return redis.call('del', KEYS[1]) 
else 
  return 0 
end

下面的加锁办法看起来如同没有问题，但如果你认真想想，如果有 1 万个申请同时去竞争那把锁，可能只有一个申请是胜利的，其余的 9999 个申请都会失败。

在秒杀场景下，会有什么问题？

答：每 1 万个申请，有 1 个胜利。再 1 万个申请，有 1 个胜利。如此上来，直到库存有余。这就变成均匀分布的秒杀了，跟咱们设想中的不一样。

如何解决这个问题呢？

其实也很简略：应用自旋锁即可。

自旋锁的思路如下：

在规定的工夫，比方 500 毫秒内，自旋一直尝试加锁
如果胜利则间接返回
如果失败，则休眠 50 毫秒，再发动新一轮的尝试。
如果到了超时工夫，还未加锁胜利，则间接返回失败。

咱们都晓得在实在的秒杀场景中，有三个外围流程：

而这三个外围流程中，真正并发量大的是秒杀性能，下单和领取性能理论并发量很小。

所以，咱们在设计秒杀零碎时，有必要把下单和领取性能从秒杀的主流程中拆解进去。

MQ 异步解决理解一下：特地是下单功能要做成 mq 异步解决的。而领取性能，比方支付宝领取，是业务场景自身就是异步的。

于是，秒杀后下单的流程变成如下：

如果应用 mq，须要关注以下几个问题：

音讯失落问题
音讯反复生产问题
垃圾音讯问题
提早生产问题

秒杀胜利了，向 MQ 发送下单音讯的时候，有可能会失败。

起因有很多，比方：网络问题、broker 挂了、mq 服务器等问题。这些状况，都可能会造成音讯失落。

那么，如何避免音讯失落呢？

加一张音讯发送表 就能够了。

其流程如下：

在生产者发送 mq 音讯之前，先把该条音讯 写入音讯发送表，初始状态是待处理
而后再发送 mq 音讯。
消费者生产音讯时，回调生产者的一个接口，解决完业务逻辑之后，批改音讯状态为已解决。

如果生产者把音讯写入音讯发送表之后，再发送 mq 音讯到 mq 服务端的过程中失败了，造成了音讯失落。

这时候，要如何解决呢？

答：应用 job，减少重试机制。用 job 每隔一段时间去查问音讯发送表中状态为待处理的数据，而后从新发送 mq 音讯。

个别状况下消费者在生产音讯，做 ACK 应答 的时候，如果网络超时，自身就可能会生产反复的音讯。

ACK 应答也称为 确认音讯应答，是在计算机网上中通信协议的一部分，是设施或是过程收回的音讯，回复已收到数据。

因为咱们后面引入了音讯发送重试机制，会导致消费者反复生产音讯的概率进一步增大。

那么，如何解决反复生产音讯的问题呢？

答案也很简略：加一张音讯处理表 即可。

消费者读到音讯之后，先判断一下音讯处理表，是否存在该音讯，如果存在，示意是反复生产，则间接返回。

如果不存在，则进行下单操作，接着将该音讯写入音讯处理表中，再返回。

有个十分要害的问题，须要大家留神：下单和写音讯处理表，要放在同一个事务中，保障原子操作。

下面这套计划外表上看起来没有问题，但如果呈现了音讯生产失败的状况。比方：因为某些起因，音讯消费者下单始终失败，始终不能回调状态变更接口，这样 job 会不停的重试发消息。最初，会产生大量的垃圾音讯。

那么，如何解决这个问题呢？

每次在 job 重试时，须要先判断一下音讯发送表中该音讯的发送次数是否达到最大限度，如果达到了，则间接返回。如果没有达到，则将音讯发送次数加 1，而后再发送音讯。

这样如果出现异常，只会产生大量的垃圾音讯，不会影响到失常的业务。

通常状况下，如果用户秒杀胜利了，下单之后，在 30 分钟之内还未实现领取的话，该订单会被主动勾销，回退库存。

那么，在 30 分钟内未实现领取，订单被主动勾销的性能，要如何实现呢？

咱们首先想到的可能是 job，因为它比较简单。

但 job 有个问题，须要每隔一段时间解决一次，实时性不太好。

还有更好的计划？

必定是有的：应用提早队列 即可。比方：RocketMQ，自带了提早队列的性能。

咱们再来梳理一下流程：

下单时音讯生产者首先生成订单，此时为待领取状态。
而后向提早队列中发一条音讯。
当达到了延迟时间，音讯消费者读取音讯之后，会查问该订单的状态是否为待领取。
如果是待领取状态，则会更新订单状态为勾销状态。
如果不是待领取状态，阐明该订单曾经领取过了，则间接返回。

留神：在咱们的业务开发中，当用户实现领取之后，会批改订单状态为已领取。这个千万不要遗记！

做秒杀流动不放心实在用户多，放心的是：

有些高手，并不会像咱们一样老老实实，通过秒杀页面点击秒杀按钮，抢购商品。他们可能在本人的服务器上，模仿失常用户登录零碎，跳过秒杀页面，间接调用秒杀接口。

如果是咱们手动操作，个别状况下，一秒钟只能点击一次秒杀按钮。

然而如果是服务器，一秒钟能够申请成上千接口。

这种差距切实太显著了，如果不做任何限度，绝大部分商品可能是被机器抢到，而不是失常用户，这就违反了搞秒杀流动的初衷。

所以，咱们有必要辨认这些非法申请，做一些限度。那么，咱们该如何限度这些非法申请呢？

为了避免某个用户，申请接口次数过于频繁，能够只针对该用户做限度。

限度同一个用户 id，比方每分钟只能申请 5 次接口。

有时候只对某个用户限流是不够的，有些高手能够模仿多个用户申请，这种 nginx 就没法辨认了。

这时须要加同一 ip 限流性能。

限度同一个 ip，比方每分钟只能申请 5 次接口。

但这种限流形式可能会有误伤的状况，比方同一个公司或网吧的进口 ip 是雷同的，如果外面有多个失常用户同时发动申请，有些用户可能会被限制住。

别以为限度了用户和 ip 就高枕无忧，有些高手甚至能够应用代理，每次都申请都换一个 ip。

这时能够限度申请的接口总次数。

在高并发场景下，这种限度对于零碎的稳定性是十分有必要的。

但可能因为有些非法申请次数太多，达到了该接口的申请下限，而影响其余的失常用户拜访该接口。个别咱们对接口限流会设置工夫，超过一段时间后则从新凋谢。

绝对于下面三种形式，加验证码的形式可能更精准一些，同样能限度用户的拜访频次，但益处是不会存在误杀的状况。

通常状况下，用户在申请之前，须要先输出验证码。
用户发动申请之后，服务端会去校验该验证码是否正确。
只有正确才容许进行下一步操作。
否则间接返回，并且提醒验证码谬误。

留神：验证码个别是一次性的，同一个验证码只容许应用一次，不容许重复使用。

一般验证码，因为生成的数字或者图案比较简单，可能会被破解。

长处是生成速度比拟快，毛病是有安全隐患。

挪动滑块，尽管它生成速度比较慢，但比拟平安，是目前各大互联网公司的首选。也有不少三方平台推出了这套服务，能够间接应用。

下面说的加验证码尽管能够限度非法用户申请，然而有些影响用户体验。用户点击秒杀按钮前，还要先输出验证码，流程显得有点繁琐，秒杀性能的流程不是应该越简略越好吗？

其实，有时候达到某个目标，不肯定非要通过技术手段，通过业务伎俩也一样。

12306 刚开始的时候，全国人民都在同一时刻抢火车票，因为并发量太大，零碎常常挂。起初，重构优化之后，将购买周期放长了，能够提前 20 天购买火车票，并且能够在 9 点、10、11 点、12 点等整点购买火车票。调整业务之后（当然技术也有很多调整），将之前集中的申请，扩散开了，一下子升高了用户并发量。

同样的，咱们的秒杀零碎也能够借鉴 12306 的计划，站在业务的角度有针对性的做优化，比方：

咱们能够通过进步业务门槛，比方只有会员能力参加秒杀流动，一般注册用户没有权限。
或者只有等级达到 3 级以上的用户，才有资格加入该流动。
或者分时间段取得秒杀资格，比方 9 点、10、11 点、加入流动取得秒杀资格，取得资格的敌人 12 点集中参加秒杀。

下面的内容也响应了一下开篇，秒杀场景除了站在技术的角度思考，也须要站在业务的角度去思考。

除了下面提到的“动态化”、“Redis 缓存”、“分布式锁”、“限流”等。数据库层隔离也是十分重要的。

针对秒杀零碎可能会影响曾经失常运行的其余数据库的状况，咱们须要思考“数据库隔离设计”。罕用以下三种办法：分表分库、数据隔离、数据合并。

数据库很容易产生性能瓶颈，导致数据库的沉闷连接数减少，一旦达到连接数的阈值，会呈现应用服务无连贯可用，造成灾难性结果。

咱们能够先从代码、SQL 语句、索引这几个方面着手优化，如果没有优化空间了，就要思考分库分表了。

以咱们的教训，Mysql 单表举荐的存储量是 500 万条记录左右。如果估算超过这个阈值，就倡议做分表。

如果服务的链接数较多，就倡议进行分库操作。

这也是咱们做秒杀零碎最大的教训分享：秒杀零碎应用的关系型数据库，绝大多数是多操作，再者是插入，只有少部分批改，简直没有删除操作。倡议用专门的表来存放数据，不倡议应用业务零碎正在应用的表来寄存秒杀相干的数据。

前文也有提到，数据隔离是必须的，万一秒杀零碎出了问题，不能影响失常业务零碎。

表的设计，除了自增 ID 之外，最好不要设置其余主键，以保障可能疾速插入。

如果咱们秒杀零碎是用的专用表存储，在秒杀流动完结后，须要将其和现有数据进行合并。

（交易曾经实现，合并的目标是为了不便后续查问）

这个合并能够依据具体情况来做，对于那些“只读”的数据，能够只导入到专门负责读的数据库或者 NoSQL 数据库中即可。

对于秒杀零碎，上线之前进行压力测试是必不可少的，不仅可能帮忙咱们优化设计，更重要的可能检测出零碎解体的边缘及零碎的极限在哪里。

只有这样，咱们能力正当的设置流量下限，把多余的流量被动摈弃掉，进而保证系统的稳定性。

简略来说：在保障服务器资源不变的状况下，网络申请一直做加法。

每次秒杀流动评估要应用多少服务器资源，接受多少申请。能够通过一直加压的形式，直到零碎靠近解体或者真正解体。

如下图所示：

负压力测试如下图所示，也很好了解：在零碎失常运行的状况下，逐步缩小撑持零碎的服务器资源，察看什么时候零碎无奈在撑持失常的业务申请。

晓得有哪些测试方法还远远不够，上面介绍的压测步骤才是最重要的内容。

为大家分享 8 个测试步骤，不止是秒杀零碎，其余须要压测的场景也能够依照这个思路进行测试：

压力测试和性能测试不同，压力测试的指标是什么时候零碎会靠近解体，比方须要反对 100 万的访问量，测试出性能阈值。

二八准则大家肯定要晓得，压力测试也是有重点的，零碎中只有 20% 的性能是最罕用的，比方秒杀接口、下单、扣减库存。要集中火力测试罕用的性能，高度还原实在场景。

和下面观点一样，不是每个服务都有高负载，测试时要重点关注高负载的服务，实在场景中服务的负载肯定是稳定的，并且不是均匀分布的。

搭建环境要和生产环境保持一致。

提前确定好要重点监测的参数指标，比方：CPU 负载、内存使用率、零碎吞吐量、带宽阈值等

倡议优先应用往期的秒杀数据，或者从生产环境中同步数据进行测试
依据指标零碎的接受要求由脚本驱动测试
模仿不同网络环境，对硬件条件有法则的进行测试

依据指标零碎、要害组件、用负载进行测试、返回监测点的数据。

针对测试的目标，对要害服务的压力测试数据进行剖析，得出这些服务的接受下限在哪里？

对有稳定的负载或者大负载的的服务进行数据分析，明确优化的方向。

秒杀零碎的我的项目实战欢送退出我的学习圈子，邀你进项目组。

总体来说，秒杀零碎是十分复杂的，咱们要依据本身的状况，抉择适合的架构。这篇文章比拟零碎的介绍了秒杀场景中常见的问题和解决方案。咱们再回顾一下开篇的思维导图：

最初再给大家 3 个倡议：

负载平衡，分而治之。通过负载平衡，将不同的流量划分到不同的机器上，每台机器解决好本人的申请，将本人的性能施展到极致。这样整个零碎的性能也就达到最高了。
正当应用并发。Go 语言可能完满施展服务器多核优势，很多能够用并发解决的工作，都能够用 Go 的协程解决。比方 Go 解决 HTTP 申请时每个申请都会在一个 goroutine 中执行。
正当应用异步。异步解决曾经被越来越多的开发者所承受，对实时性要求不高的业务都能够用异步来解决，在性能拆解上能达到意想不到的成果。

我的文章首发在我的公众号：程序员升职加薪之旅，欢送大家关注，第一工夫浏览我的文章。

也欢送大家关注我，点赞、留言、转发。你的反对，是我更文的最大能源！

关于后端:一文搞懂秒杀系统欢迎参与开源提交PR提高竞争力早日上岸升职加薪

前言

知识点详解

秒杀零碎架构图

秒杀流程图

秒杀零碎设计

1. 刹时高并发

秒杀业务的场景

2. 流动页面

CDN

3 秒杀按钮

更新 CDN

前端骚操作

4 读多写少

5 缓存

5.1 缓存击穿

预热

双保险

5.2 缓存穿透

数据一致性

利用场景

奇妙的设计

6 库存问题

预扣库存

6.1 数据库扣减库存

优雅的计划

进一步思考：

6.2 redis 扣减库存

6.3 Lua 脚本扣减库存

7 分布式锁

7.1 setNx 加锁

7.2 set 加锁

7.3 开释锁

7.4 自旋锁

8 mq 异步解决

8.1 音讯失落问题

音讯重发

8.2 反复生产问题

8.3 垃圾音讯问题

限度重试次数

8.4 提早生产问题

9 限流

9.1 对同一用户限流

9.2 对同一 ip 限流

误伤问题

9.3 对接口限流

9.4 加验证码

一般验证码

滑块验证码

9.5 进步业务门槛

数据库层隔离

10.1 分库分表

10.2 数据隔离

10.3 数据合并

11 压力测试

11.1 压测办法

正压力测试

负压力测试

11.2 压测步骤

1. 确定测试指标

2. 确定关键问题

3. 确定负载

4. 搭建环境

5. 确定监测指标

6. 产生负载

7. 执行测试

8. 剖析数据

我的项目实战

总结

一起学习

Just My Socks（注册教程 内含优惠码）

Just My Socks（注册教程内含优惠码）