架构设计-高并发流量削峰共享资源加锁机制

本文源码：GitHub·点这里 || GitEE·点这里

在互联网的业务架构中，高并发是最难处理的业务之一，常见的使用场景：秒杀，抢购，订票系统；高并发的流程中需要处理的复杂问题非常多，主要涉及下面几个方面：

流量管理，逐级承接削峰；
网关控制，路由请求，接口熔断；
并发控制机制，资源加锁；
分布式架构，隔离服务和数据库；

高并发业务核心还是流量控制，控制流量下沉速度，或者控制承接流量的容器大小，多余的直接溢出，这是相对复杂的流程。其次就是多线程并发下访问共享资源，该流程需要加锁机制，避免数据写出现错乱情况。

活动未正式开始，先进行活动预约，先把一部分流量收集和控制起来，在真正秒杀的时间点，很多数据可能都已经预处理好了，可以很大程度上削减系统的压力。有了一定预约流量还可以提前对库存系统做好准备，一举两得。

场景：活动预约，定金预约，高铁抢票预购。

分批抢购和抢购的场景实现的机制是一致的，只是在流量上缓解了很多压力，秒杀 10W 件库存和秒杀 100 件库存系统的抗压不是一个级别。如果秒杀 10W 件库存，系统至少承担多于 10W 几倍的流量冲击，秒杀 100 件库存，体系可能承担几百或者上千的流量就结束了。下面流量削峰会详解这里的策略机制。

场景：分时段多场次抢购，高铁票分批放出。

最有难度的场景就是准点实时的秒杀活动，假如 10 点整准时抢 1W 件商品，在这个时间点前后会涌入高并发的流量，刷新页面，或者请求抢购的接口，这样的场景处理起来是最复杂的。

首先系统要承接住流量的涌入；
页面的不断刷新要实时加载；
高并发请求的流量控制加锁等；
服务隔离和数据库设计的系统保护；

场景：618 准点抢购，双 11 准点秒杀，电商促销秒杀。

Nginx 是一个高性能的 HTTP 和反向代理 web 服务器，经常用在集群服务中做统一代理层和负载均衡策略，也可以作为一层流量控制层，提供两种限流方式，一是控制速率，二是控制并发连接数。

基于漏桶算法，提供限制请求处理速率能力；限制 IP 的访问频率，流量突然增大时，超出的请求将被拒绝；还可以限制并发连接数。

高并发的秒杀场景下，经过 Nginx 层的各种限制策略，可以控制流量在一个相对稳定的状态。

CDN 静态文件的代理节点，秒杀场景的服务有这样一个操作特点，活动倒计时开始之前，大量的用户会不断的刷新页面，这时候静态页面可以交给 CDN 层面代理，分担数据服务接口的压力。

CDN 层面也可以做一层限流，在页面内置一层策略，假设有 10W 用户点击抢购，可以只放行 1W 的流量，其他的直接提示活动结束即可，这也是常用的手段之一。

话外之意：平时参与的抢购活动，可能你的请求根本没有到达数据接口层面，就极速响应商品已抢完，自行意会吧。

网关层面处理服务接口路由，一些校验之外，最主要的是可以集成一些策略进入网关，比如经过上述层层的流量控制之后，请求已经接近核心的数据接口，这时在网关层面内置一些策略控制：如果活动是想激活老用户，网关层面快速判断用户属性，老用户会放行请求；如果活动的目的是拉新，则放行更多的新用户。

经过这些层面的控制，剩下的流量已经不多了，后续才真正开始执行抢购的数据操作。

话外之意：如果有 10W 人参加抢购活动，真正下沉到底层的抢购流量可能就 1W，甚至更少，在分散到集群服务中处理。

在分布式服务的接口中，还有最精细的一层控制，对于一个接口在单位之间内控制请求处理的数量，这个基于接口的响应时间综合考虑，响应越快，单位时间内的并发量就越高，这里逻辑不难理解。

言外之意：流量经过层层控制，数据接口层面分担的压力已经不大，这时候就是面对秒杀业务中的加锁问题了。

机制描述

所有请求的线程必须在获取锁之后，才能执行数据库操作，并且基于序列化的模式，没有获取锁的线程处于等待状态，并且设定重试机制，在单位时间后再次尝试获取锁，或者直接返回。

过程图解

Redis 基础命令

SETNX：加锁的思路是，如果 key 不存在，将 key 设置为 value 如果 key 已存在，则 SETNX 不做任何动作。并且可以给 key 设置过期时间，过期后其他线程可以继续尝试锁获取机制。

借助 Redis 的该命令模拟锁的获取动作。

代码实现

这里基于 Redis 实现的锁获取和释放机制。

import org.springframework.stereotype.Component;
import redis.clients.jedis.Jedis;
import javax.annotation.Resource;
@Component
public class RedisLock {

    @Resource
    private Jedis jedis ;

    /**
     * 获取锁
     */
    public boolean getLock (String key,String value,long expire){
        try {String result = jedis.set( key, value, "nx", "ex", expire);
            return result != null;
        } catch (Exception e){e.printStackTrace();
        }finally {if (jedis != null) jedis.close();}
        return false ;
    }

    /**
     * 释放锁
     */
    public boolean unLock (String key){
        try {Long result = jedis.del(key);
            return result > 0 ;
        } catch (Exception e){e.printStackTrace();
        }finally {if (jedis != null) jedis.close();}
        return false ;
    }
}

这里基于 Jedis 的 API 实现，这里提供一份配置文件。

@Configuration
public class RedisConfig {

    @Bean
    public JedisPoolConfig jedisPoolConfig (){JedisPoolConfig jedisPoolConfig = new JedisPoolConfig() ;
        jedisPoolConfig.setMaxIdle(8);
        jedisPoolConfig.setMaxTotal(20);
        return jedisPoolConfig ;
    }

    @Bean
    public JedisPool jedisPool (@Autowired JedisPoolConfig jedisPoolConfig){return new JedisPool(jedisPoolConfig,"127.0.0.1",6379) ;
    }

    @Bean
    public Jedis jedis (@Autowired JedisPool jedisPool){return jedisPool.getResource() ;
    }
}

问题描述

在实际的系统运行期间可能出现如下情况：线程 01 获取锁之后，进程被挂起，后续该执行的没有执行，锁失效后，线程 02 又获取锁，在数据库更新后，线程 01 恢复，此时在持有锁之后的状态，继续执行后就会容易导致数据错乱问题。

这时候就需要引入锁版本概念的，假设线程 01 获取锁版本 1，如果没有执行，线程 02 获取锁版本 2，执行之后，通过锁版本的比较，线程 01 的锁版本过低，数据更新就会失败。

CREATE TABLE `dl_data_lock` (`id` INT (11) NOT NULL AUTO_INCREMENT COMMENT '主键 ID',
    `inventory` INT (11) DEFAULT '0' COMMENT '库存量',
    `lock_value` INT (11) NOT NULL DEFAULT '0' COMMENT '锁版本',
    PRIMARY KEY (`id`)
) ENGINE = INNODB DEFAULT CHARSET = utf8 COMMENT = '锁机制表';

说明：lock_value 就是记录锁版本，作为控制数据更新的条件。

<update id="updateByLock">
    UPDATE dl_data_lock SET inventory=inventory-1,lock_value=#{lockVersion}
    WHERE id=#{id} AND lock_value &lt;#{lockVersion}
</update>

说明：这里的更新操作，不但要求线程获取锁，还会判断线程锁的版本不能低于当前更新记录中的最新锁版本。

机制描述

乐观锁大多是基于数据记录来控制，在更新数据库的时候，基于前置的查询条件判断，如果查询出来的数据没有被修改，则更新操作成功，如果前置的查询结果作为更新的条件不成立，则数据写失败。

过程图解

代码实现

业务流程，先查询要更新的记录，然后把读取的列，作为更新条件。

@Override
public Boolean updateByInventory(Integer id) {DataLockEntity dataLockEntity = dataLockMapper.getById(id);
    if (dataLockEntity != null){return dataLockMapper.updateByInventory(id,dataLockEntity.getInventory())>0 ;
    }
    return false ;
}

例如如果要把库存更新，就把读取的库存数据作为更新条件，如果读取库存是 100，在更新的时候库存变了，则更新条件自然不能成立。

<update id="updateByInventory">
    UPDATE dl_data_lock SET inventory=inventory-1 WHERE id=#{id} AND inventory=#{inventory}
</update>

在处理高并发的秒杀场景时，经常出现服务挂掉场景，常见某些 APP 的营销页面，出现活动火爆页面丢失的提示情况，但是不影响整体应用的运行，这就是服务的隔离和保护机制。

基于分布式的服务结构可以把高并发的业务服务独立出来，不会因为秒杀服务挂掉影响整体的服务，导致服务雪崩的场景。

数据库保护和服务保护是相辅相成的，分布式服务架构下，服务和数据库是对应的，理论上秒杀服务对应的就是秒杀数据库，不会因为秒杀库挂掉，导致整个数据库宕机。

GitHub·地址
https://github.com/cicadasmile/data-manage-parent
GitEE·地址
https://gitee.com/cicadasmile/data-manage-parent

推荐阅读：《架构设计系列》，萝卜青菜，各有所需

序号	标题
00	架构设计：单服务. 集群. 分布式，基本区别和联系
01	架构设计：分布式业务系统中，全局 ID 生成策略
02	架构设计：分布式系统调度，Zookeeper 集群化管理
03	架构设计：接口幂等性原则，防重复提交 Token 管理
04	架构设计：缓存管理模式，监控和内存回收策略
05	架构设计：异步处理流程，多种实现模式详解

架构设计-高并发流量削峰共享资源加锁机制

一、高并发简介

二、秒杀场景

1、预抢购业务

2、分批抢购

3、实时秒杀

三、流量削峰

1、Nginx 代理

2、CDN 节点

3、网关控制

4、并发熔断

四、分布式加锁

1、悲观锁

2、乐观锁

五、分布式服务

1、服务保护

2、数据库保护

六、源代码地址