架构设计-高并发流量削峰共享资源加锁机制

49次阅读

共计 4508 个字符,预计需要花费 12 分钟才能阅读完成。

本文源码:GitHub·点这里 || GitEE·点这里

一、高并发简介

在互联网的业务架构中,高并发是最难处理的业务之一,常见的使用场景:秒杀,抢购,订票系统;高并发的流程中需要处理的复杂问题非常多,主要涉及下面几个方面:

  • 流量管理,逐级承接削峰;
  • 网关控制,路由请求,接口熔断;
  • 并发控制机制,资源加锁;
  • 分布式架构,隔离服务和数据库;

高并发业务核心还是流量控制,控制流量下沉速度,或者控制承接流量的容器大小,多余的直接溢出,这是相对复杂的流程。其次就是多线程并发下访问共享资源,该流程需要加锁机制,避免数据写出现错乱情况。

二、秒杀场景

1、预抢购业务

活动未正式开始,先进行活动预约,先把一部分流量收集和控制起来,在真正秒杀的时间点,很多数据可能都已经预处理好了,可以很大程度上削减系统的压力。有了一定预约流量还可以提前对库存系统做好准备,一举两得。

场景:活动预约,定金预约,高铁抢票预购。

2、分批抢购

分批抢购和抢购的场景实现的机制是一致的,只是在流量上缓解了很多压力,秒杀 10W 件库存和秒杀 100 件库存系统的抗压不是一个级别。如果秒杀 10W 件库存,系统至少承担多于 10W 几倍的流量冲击,秒杀 100 件库存,体系可能承担几百或者上千的流量就结束了。下面流量削峰会详解这里的策略机制。

场景:分时段多场次抢购,高铁票分批放出。

3、实时秒杀

最有难度的场景就是准点实时的秒杀活动,假如 10 点整准时抢 1W 件商品,在这个时间点前后会涌入高并发的流量,刷新页面,或者请求抢购的接口,这样的场景处理起来是最复杂的。

  • 首先系统要承接住流量的涌入;
  • 页面的不断刷新要实时加载;
  • 高并发请求的流量控制加锁等;
  • 服务隔离和数据库设计的系统保护;

场景:618 准点抢购,双 11 准点秒杀,电商促销秒杀。

三、流量削峰

1、Nginx 代理

Nginx 是一个高性能的 HTTP 和反向代理 web 服务器,经常用在集群服务中做统一代理层和负载均衡策略,也可以作为一层流量控制层,提供两种限流方式,一是控制速率,二是控制并发连接数。

基于漏桶算法,提供限制请求处理速率能力;限制 IP 的访问频率,流量突然增大时,超出的请求将被拒绝;还可以限制并发连接数。

高并发的秒杀场景下,经过 Nginx 层的各种限制策略,可以控制流量在一个相对稳定的状态。

2、CDN 节点

CDN 静态文件的代理节点,秒杀场景的服务有这样一个操作特点,活动倒计时开始之前,大量的用户会不断的刷新页面,这时候静态页面可以交给 CDN 层面代理,分担数据服务接口的压力。

CDN 层面也可以做一层限流,在页面内置一层策略,假设有 10W 用户点击抢购,可以只放行 1W 的流量,其他的直接提示活动结束即可,这也是常用的手段之一。

话外之意:平时参与的抢购活动,可能你的请求根本没有到达数据接口层面,就极速响应商品已抢完,自行意会吧。

3、网关控制

网关层面处理服务接口路由,一些校验之外,最主要的是可以集成一些策略进入网关,比如经过上述层层的流量控制之后,请求已经接近核心的数据接口,这时在网关层面内置一些策略控制:如果活动是想激活老用户,网关层面快速判断用户属性,老用户会放行请求;如果活动的目的是拉新,则放行更多的新用户。

经过这些层面的控制,剩下的流量已经不多了,后续才真正开始执行抢购的数据操作。

话外之意:如果有 10W 人参加抢购活动,真正下沉到底层的抢购流量可能就 1W,甚至更少,在分散到集群服务中处理。

4、并发熔断

在分布式服务的接口中,还有最精细的一层控制,对于一个接口在单位之间内控制请求处理的数量,这个基于接口的响应时间综合考虑,响应越快,单位时间内的并发量就越高,这里逻辑不难理解。

言外之意:流量经过层层控制,数据接口层面分担的压力已经不大,这时候就是面对秒杀业务中的加锁问题了。

四、分布式加锁

1、悲观锁

机制描述

所有请求的线程必须在获取锁之后,才能执行数据库操作,并且基于序列化的模式,没有获取锁的线程处于等待状态,并且设定重试机制,在单位时间后再次尝试获取锁,或者直接返回。

过程图解

Redis 基础命令

SETNX:加锁的思路是,如果 key 不存在,将 key 设置为 value 如果 key 已存在,则 SETNX 不做任何动作。并且可以给 key 设置过期时间,过期后其他线程可以继续尝试锁获取机制。

借助 Redis 的该命令模拟锁的获取动作。

代码实现

这里基于 Redis 实现的锁获取和释放机制。

import org.springframework.stereotype.Component;
import redis.clients.jedis.Jedis;
import javax.annotation.Resource;
@Component
public class RedisLock {

    @Resource
    private Jedis jedis ;

    /**
     * 获取锁
     */
    public boolean getLock (String key,String value,long expire){
        try {String result = jedis.set( key, value, "nx", "ex", expire);
            return result != null;
        } catch (Exception e){e.printStackTrace();
        }finally {if (jedis != null) jedis.close();}
        return false ;
    }

    /**
     * 释放锁
     */
    public boolean unLock (String key){
        try {Long result = jedis.del(key);
            return result > 0 ;
        } catch (Exception e){e.printStackTrace();
        }finally {if (jedis != null) jedis.close();}
        return false ;
    }
}

这里基于 Jedis 的 API 实现,这里提供一份配置文件。

@Configuration
public class RedisConfig {

    @Bean
    public JedisPoolConfig jedisPoolConfig (){JedisPoolConfig jedisPoolConfig = new JedisPoolConfig() ;
        jedisPoolConfig.setMaxIdle(8);
        jedisPoolConfig.setMaxTotal(20);
        return jedisPoolConfig ;
    }

    @Bean
    public JedisPool jedisPool (@Autowired JedisPoolConfig jedisPoolConfig){return new JedisPool(jedisPoolConfig,"127.0.0.1",6379) ;
    }

    @Bean
    public Jedis jedis (@Autowired JedisPool jedisPool){return jedisPool.getResource() ;
    }
}

问题描述

在实际的系统运行期间可能出现如下情况:线程 01 获取锁之后,进程被挂起,后续该执行的没有执行,锁失效后,线程 02 又获取锁,在数据库更新后,线程 01 恢复,此时在持有锁之后的状态,继续执行后就会容易导致数据错乱问题。

这时候就需要引入锁版本概念的,假设线程 01 获取锁版本 1,如果没有执行,线程 02 获取锁版本 2,执行之后,通过锁版本的比较,线程 01 的锁版本过低,数据更新就会失败。

CREATE TABLE `dl_data_lock` (`id` INT (11) NOT NULL AUTO_INCREMENT COMMENT '主键 ID',
    `inventory` INT (11) DEFAULT '0' COMMENT '库存量',
    `lock_value` INT (11) NOT NULL DEFAULT '0' COMMENT '锁版本',
    PRIMARY KEY (`id`)
) ENGINE = INNODB DEFAULT CHARSET = utf8 COMMENT = '锁机制表';

说明:lock_value 就是记录锁版本,作为控制数据更新的条件。

<update id="updateByLock">
    UPDATE dl_data_lock SET inventory=inventory-1,lock_value=#{lockVersion}
    WHERE id=#{id} AND lock_value &lt;#{lockVersion}
</update>

说明:这里的更新操作,不但要求线程获取锁,还会判断线程锁的版本不能低于当前更新记录中的最新锁版本。

2、乐观锁

机制描述

乐观锁大多是基于数据记录来控制,在更新数据库的时候,基于前置的查询条件判断,如果查询出来的数据没有被修改,则更新操作成功,如果前置的查询结果作为更新的条件不成立,则数据写失败。

过程图解

代码实现

业务流程,先查询要更新的记录,然后把读取的列,作为更新条件。

@Override
public Boolean updateByInventory(Integer id) {DataLockEntity dataLockEntity = dataLockMapper.getById(id);
    if (dataLockEntity != null){return dataLockMapper.updateByInventory(id,dataLockEntity.getInventory())>0 ;
    }
    return false ;
}

例如如果要把库存更新,就把读取的库存数据作为更新条件,如果读取库存是 100,在更新的时候库存变了,则更新条件自然不能成立。

<update id="updateByInventory">
    UPDATE dl_data_lock SET inventory=inventory-1 WHERE id=#{id} AND inventory=#{inventory}
</update>

五、分布式服务

1、服务保护

在处理高并发的秒杀场景时,经常出现服务挂掉场景,常见某些 APP 的营销页面,出现活动火爆页面丢失的提示情况,但是不影响整体应用的运行,这就是服务的隔离和保护机制。

基于分布式的服务结构可以把高并发的业务服务独立出来,不会因为秒杀服务挂掉影响整体的服务,导致服务雪崩的场景。

2、数据库保护

数据库保护和服务保护是相辅相成的,分布式服务架构下,服务和数据库是对应的,理论上秒杀服务对应的就是秒杀数据库,不会因为秒杀库挂掉,导致整个数据库宕机。

六、源代码地址

GitHub·地址
https://github.com/cicadasmile/data-manage-parent
GitEE·地址
https://gitee.com/cicadasmile/data-manage-parent

推荐阅读:《架构设计系列》,萝卜青菜,各有所需

序号 标题
00 架构设计:单服务. 集群. 分布式,基本区别和联系
01 架构设计:分布式业务系统中,全局 ID 生成策略
02 架构设计:分布式系统调度,Zookeeper 集群化管理
03 架构设计:接口幂等性原则,防重复提交 Token 管理
04 架构设计:缓存管理模式,监控和内存回收策略
05 架构设计:异步处理流程,多种实现模式详解

正文完
 0