关于java:差点被开除一次订单号重复的事故

11次阅读

共计 5840 个字符，预计需要花费 15 分钟才能阅读完成。

去年年底的时候，咱们线上出了一次事变，这个事变的表象是这样的:

零碎呈现了两个截然不同的订单号，订单的内容却不是不一样的，而且零碎在依照订单号查问的时候始终抛错，也没法失常回调，而且事件产生的不止一次，所以这次系统升级肯定要解决掉。

经手的共事之前也改过几次，不过成果始终不好：总会呈现订单号反复的问题，所以趁着这次问题我好好的理了一下我共事写的代码。
这里简要展现下过后的代码：

      /**
    * OD 单号生成
    * 订单号生成规定：OD + yyMMddHHmmssSSS + 5 位数(商户 ID3 位 + 随机数 2 位) 22 位
    */
   public static String getYYMMDDHHNumber(String merchId){StringBuffer orderNo = new StringBuffer(new SimpleDateFormat("yyMMddHHmmssSSS").format(new Date()));
          if(StringUtils.isNotBlank(merchId)){if(merchId.length()>3){orderNo.append(merchId.substring(0,3));
              }else {orderNo.append(merchId);
              }
          }
          int orderLength = orderNo.toString().length();
          String randomNum = getRandomByLength(20-orderLength);
          orderNo.append(randomNum);
          return orderNo.toString();}
  
  
      /** 生成指定位数的随机数 **/
      public static String getRandomByLength(int size){if(size>8 || size<1){return "";}
          Random ne = new Random();
          StringBuffer endNumStr = new StringBuffer("1");
          StringBuffer staNumStr = new StringBuffer("9");
          for(int i=1;i<size;i++){endNumStr.append("0");
              staNumStr.append("0");
          }
          int randomNum = ne.nextInt(Integer.valueOf(staNumStr.toString()))+Integer.valueOf(endNumStr.toString());
          return String.valueOf(randomNum);
      }

能够看到，这段代码写的其实不怎么好，代码局部暂且不议，代码中使订单号不反复的次要因素点是随机数和毫秒，可是这里的随机数只有两位

在高并发环境下极容易呈现反复问题，同时毫秒这一抉择也不是很好，在多核 CPU 多线程下，肯定工夫内 (极小的) 这个毫秒能够说是固定不变的(测试验证过)，所以这里我先以 100 个并发测试下这个订单号生成，关注微信订阅号码匠笔记，回复架构获取一些列的架构常识。测试代码如下：

    public static void main(String[] args) {
        final String merchId = "12334";
        List<String> orderNos = Collections.synchronizedList(new ArrayList<String>());
        IntStream.range(0,100).parallel().forEach(i->{orderNos.add(getYYMMDDHHNumber(merchId));
        });

        List<String> filterOrderNos = orderNos.stream().distinct().collect(Collectors.toList());

        System.out.println("生成订单数："+orderNos.size());
        System.out.println("过滤反复后订单数："+filterOrderNos.size());
        System.out.println("反复订单数："+(orderNos.size()-filterOrderNos.size()));
    }

果然，测试的后果如下：

生成订单数：100
过滤反复后订单数：87
反复订单数：13

过后我就震惊🤯了，一百个并发外面居然有 13 个反复的！！！，我连忙让同当时不要发版，这活儿我接了！

对这一烫手的山竽拿到手里没有一个清晰的解决方案可是不行的，我大略花了 6 + 分钟和共事磋商了下业务场景，决定做如下更改：

去掉商户 ID 的传入(按共事的说法, 传入商户 ID 也是为了避免反复订单的，事实证明并没有叼用)
毫秒仅保留三位(缩减长度同时保障利用切换不存在反复的可能)
应用线程平安的计数器做数字递增(三位数最低保障并发 800 不反复, 代码中我给了 4 位)
更换日期转换为 java8 的日期类以格式化(线程平安及代码简洁性考量)

通过以上思考后我的最终代码是：

    /** 订单号生成(NEW) **/
    private static final AtomicInteger SEQ = new AtomicInteger(1000);
    private static final DateTimeFormatter DF_FMT_PREFIX = DateTimeFormatter.ofPattern("yyMMddHHmmssSS");
    private static ZoneId ZONE_ID = ZoneId.of("Asia/Shanghai");
    public static String generateOrderNo(){LocalDateTime dataTime = LocalDateTime.now(ZONE_ID);
        if(SEQ.intValue()>9990){SEQ.getAndSet(1000);
        }
        return  dataTime.format(DF_FMT_PREFIX)+SEQ.getAndIncrement();}

当然代码写实现了可不能这么随随便便完结了，当初得走一个测试 main 函数看看：

    public static void main(String[] args) {List<String> orderNos = Collections.synchronizedList(new ArrayList<String>());
        IntStream.range(0,8000).parallel().forEach(i->{orderNos.add(generateOrderNo());
        });

        List<String> filterOrderNos = orderNos.stream().distinct().collect(Collectors.toList());

        System.out.println("生成订单数："+orderNos.size());
        System.out.println("过滤反复后订单数："+filterOrderNos.size());
        System.out.println("反复订单数："+(orderNos.size()-filterOrderNos.size()));
    }
    
    /**
        测试后果：生成订单数：8000
        过滤反复后订单数：8000
        反复订单数：0
    **/

真好，一次就胜利了，能够间接上线了。。。

然而，我回过头来看以上代码，尽管最大水平解决了并发单号反复的问题，不过对于咱们的零碎架构还是有一个潜在的隐患：如果以后利用有多个实例 (集群) 难道就没有反复的可能了？关注微信订阅号码匠笔记，回复架构获取一些列的架构常识。

鉴于此问题就必然须要一个无效的解决方案，所以这时我就思考：多个实例利用订单号如何辨别开呢？以下为我思考的大抵方向：

应用 UUID(在第一次生成订单号时初始化一个)
应用 redis 记录一个增长 ID
应用数据库表保护一个增长 ID
利用所在的网络 IP
利用所在的端口号
应用第三方算法(雪花算法等等)
应用过程 ID(某种程度下是一个可行的计划)

在此我想了下，咱们的利用是跑在 docker 外面，而且每个 docker 容器内的利用端口都一样，不过网路 IP 不会存在反复的问题，至于过程也有存在反复的可能，对于 UUID 的形式之前吃过亏，总之吧，redis 或 DB 也算是一种比拟好的形式，不过独立性较差。。。

同时还有一个因素也很重要，就是所有波及到订单号生成的利用都是在同一台宿主机 (linux 实体服务器) 上，所以就目前的零碎架构我选用了 IP 的形式。

一下是我的代码：

import org.apache.commons.lang3.RandomUtils;

import java.net.InetAddress;
import java.time.LocalDateTime;
import java.time.ZoneId;
import java.time.format.DateTimeFormatter;
import java.util.ArrayList;
import java.util.Collections;
import java.util.List;
import java.util.concurrent.atomic.AtomicInteger;
import java.util.stream.Collectors;
import java.util.stream.IntStream;

public class OrderGen2Test {

    /** 订单号生成 **/
    private static ZoneId ZONE_ID = ZoneId.of("Asia/Shanghai");
    private static final AtomicInteger SEQ = new AtomicInteger(1000);
    private static final DateTimeFormatter DF_FMT_PREFIX = DateTimeFormatter.ofPattern("yyMMddHHmmssSS");
    public static String generateOrderNo(){LocalDateTime dataTime = LocalDateTime.now(ZONE_ID);
        if(SEQ.intValue()>9990){SEQ.getAndSet(1000);
        }
        return  dataTime.format(DF_FMT_PREFIX)+ getLocalIpSuffix()+SEQ.getAndIncrement();
    }

    private volatile static String IP_SUFFIX = null;
    private static String getLocalIpSuffix (){if(null != IP_SUFFIX){return IP_SUFFIX;}
        try {synchronized (OrderGen2Test.class){if(null != IP_SUFFIX){return IP_SUFFIX;}
                InetAddress addr = InetAddress.getLocalHost();
                //  172.17.0.4  172.17.0.199 ,
                String hostAddress = addr.getHostAddress();
                if (null != hostAddress && hostAddress.length() > 4) {String ipSuffix = hostAddress.trim().split("\\.")[3];
                    if (ipSuffix.length() == 2) {
                        IP_SUFFIX = ipSuffix;
                        return IP_SUFFIX;
                    }
                    ipSuffix = "0" + ipSuffix;
                    IP_SUFFIX = ipSuffix.substring(ipSuffix.length() - 2);
                    return IP_SUFFIX;
                }
                IP_SUFFIX = RandomUtils.nextInt(10, 20) + "";
                return IP_SUFFIX;
            }
        }catch (Exception e){System.out.println("获取 IP 失败:"+e.getMessage());
            IP_SUFFIX =  RandomUtils.nextInt(10,20)+"";
            return IP_SUFFIX;
        }
    }


    public static void main(String[] args) {List<String> orderNos = Collections.synchronizedList(new ArrayList<String>());
        IntStream.range(0,8000).parallel().forEach(i->{orderNos.add(generateOrderNo());
        });

        List<String> filterOrderNos = orderNos.stream().distinct().collect(Collectors.toList());

        System.out.println("订单样例："+ orderNos.get(22));
        System.out.println("生成订单数："+orderNos.size());
        System.out.println("过滤反复后订单数："+filterOrderNos.size());
        System.out.println("反复订单数："+(orderNos.size()-filterOrderNos.size()));
    }
}

/**
  订单样例：20082115575546011022
  生成订单数：8000
  过滤反复后订单数：8000
  反复订单数：0
**/

最初

代码阐明及几点倡议

generateOrderNo()办法内不须要加锁，因为 AtomicInteger 内应用的是 CAS 自旋转锁(保障可见性的同时也保障原子性, 具体的请自行理解)
getLocalIpSuffix()办法内不须要对不为 null 的逻辑加同步锁(双向校验锁，整体是一种平安的单例模式)
自己实现的形式并不是解决问题的惟一形式，具体解决问题须要视以后零碎架构具体而论
任何测试都是必要的，我共事在前几次尝试解决这个问题后都没有自测，不测试有损开发专业性！

作者：funnyZpC
cnblogs.com/funnyzpc/p/13541713.html

正文完