如何看待Spring下单例模式与线程安全的矛盾

96次阅读

共计 4398 个字符,预计需要花费 11 分钟才能阅读完成。

前言
有多少人在使用 Spring 框架时,很多时候不知道或者忽视了多线程的问题?
  因为写程序时,或做单元测试时,很难有机会碰到多线程的问题,因为没有那么容易模拟多线程测试的环境。那么当多个线程调用同一个 bean 的时候就会存在线程安全问题。如果是 Spring 中 bean 的创建模式为非单例的,也就不存在这样的问题了。
  但如果不去考虑潜在的漏洞,它就会变成程序的隐形杀手,在你不知道的时候爆发。而且,通常是程序交付使用时,在生产环境下触发,会是很麻烦的事。

Spring 使用 ThreadLocal 解决线程安全问题
  我们知道在一般情况下,只有无状态的 Bean 才可以在多线程环境下共享,在 Spring 中,绝大部分 Bean 都可以声明为 singleton 作用域。就是因为 Spring 对一些 Bean(如 RequestContextHolder、TransactionSynchronizationManager、LocaleContextHolder 等)中非线程安全状态采用 ThreadLocal 进行处理,让它们也成为线程安全的状态,因为有状态的 Bean 就可以在多线程中共享了。
  一般的 Web 应用划分为展现层、服务层和持久层三个层次,在不同的层中编写对应的逻辑,下层通过接口向上层开放功能调用。在一般情况下,从接收请求到返回响应所经过的所有程序调用都同属于一个线程
  ThreadLocal 是解决线程安全问题一个很好的思路,它通过为每个线程提供一个独立的变量副本解决了变量并发访问的冲突问题。在很多情况下,ThreadLocal 比直接使用 synchronized 同步机制解决线程安全问题更简单,更方便,且结果程序拥有更高的并发性。
  如果你的代码所在的进程中有多个线程在同时运行,而这些线程可能会同时运行这段代码。如果每次运行结果和单线程运行的结果是一样的,而且其他的变量的值也和预期的是一样的,就是线程安全的。或者说: 一个类或者程序所提供的接口对于线程来说是原子操作或者多个线程之间的切换不会导致该接口的执行结果存在二义性, 也就是说我们不用考虑同步的问题。线程安全问题都是由全局变量及静态变量引起的。
  若每个线程中对全局变量、静态变量只有读操作,而无写操作,一般来说,这个全局变量是线程安全的;若有多个线程同时执行写操作,一般都需要考虑线程同步,否则就可能影响线程安全。1)常量始终是线程安全的,因为只存在读操作。2)每次调用方法前都新建一个实例是线程安全的,因为不会访问共享的资源。3)局部变量是线程安全的。因为每执行一个方法,都会在独立的空间创建局部变量,它不是共享的资源。局部变量包括方法的参数变量和方法内变量。
  有状态就是有数据存储功能。有状态对象 (Stateful Bean),就是有实例变量的对象,可以保存数据,是非线程安全的。在不同方法调用间不保留任何状态。
  无状态就是一次操作,不能保存数据。无状态对象 (Stateless Bean),就是没有实例变量的对象 . 不能保存数据,是不变类,是线程安全的。
有状态对象:
  无状态的 Bean 适合用不变模式,技术就是单例模式,这样可以共享实例,提高性能。有状态的 Bean,多线程环境下不安全,那么适合用 Prototype 原型模式。Prototype: 每次对 bean 的请求都会创建一个新的 bean 实例。
  Struts2 默认的实现是 Prototype 模式。也就是每个请求都新生成一个 Action 实例,所以不存在线程安全问题。需要注意的是,如果由 Spring 管理 action 的生命周期,scope 要配成 prototype 作用域

线程安全案例
  SimpleDateFormat(下面简称 sdf) 类内部有一个 Calendar 对象引用 , 它用来储存和这个 sdf 相关的日期信息 , 例如 sdf.parse(dateStr), sdf.format(date)  诸如此类的方法参数传入的日期相关 String, Date 等等 ,  都是交友 Calendar 引用来储存的 . 这样就会导致一个问题 , 如果你的 sdf 是个 static 的 ,  那么多个 thread  之间就会共享这个 sdf, 同时也是共享这个 Calendar 引用 ,  并且 ,  观察  sdf.parse()  方法 , 你会发现有如下的调用 :
Date parse() {
calendar.clear(); // 清理 calendar
… // 执行一些操作, 设置 calendar 的日期什么的
calendar.getTime(); // 获取 calendar 的时间
}
  这里会导致的问题就是 ,  如果 线程 A  调用了  sdf.parse(),  并且进行了 calendar.clear() 后还未执行 calendar.getTime() 的时候 , 线程 B 又调用了 sdf.parse(), 这时候线程 B 也执行了 sdf.clear() 方法 ,  这样就导致线程 A 的的 calendar 数据被清空了 ( 实际上 A,B 的同时被清空了).  又或者当  A  执行了 calendar.clear()  后被挂起 ,  这时候 B  开始调用 sdf.parse() 并顺利 i 结束 ,  这样  A  的  calendar 内存储的的 date 变成了后来 B 设置的 calendar 的 date
  这个问题背后隐藏着一个更为重要的问题 — 无状态:无状态方法的好处之一,就是它在各种环境下,都可以安全的调用。衡量一个方法是否是有状态的,就看它是否改动了其它的东西,比如全局变量,比如实例的字段。format 方法在运行过程中改动了 SimpleDateFormat 的 calendar 字段,所以,它是有状态的。
  这也同时提醒我们在开发和设计系统的时候注意下以下三点 :

自己写公用类的时候,要对多线程调用情况下的后果在注释里进行明确说明
对线程环境下,对每一个共享的可变变量都要注意其线程安全性
我们的类和方法在做设计的时候,要尽量设计成无状态的

解决办法
1. 需要的时候创建新实例:
  说明:在需要用到 SimpleDateFormat  的地方新建一个实例,不管什么时候,将有线程安全问题的对象由共享变为局部私有都能避免多线程问题,不过也加重了创建对象的负担。在一般情况下,这样其实对性能影响比不是很明显的。
2. 使用同步:同步 SimpleDateFormat 对象
public class DateSyncUtil {
private static SimpleDateFormat sdf = new SimpleDateFormat(“yyyy-MM-dd HH:mm:ss”);

public static String formatDate(Date date)throws ParseException{
synchronized(sdf){
return sdf.format(date);
}
}

public static Date parse(String strDate) throws ParseException{
synchronized(sdf){
return sdf.parse(strDate);
}
}
}
  说明:当线程较多时,当一个线程调用该方法时,其他想要调用此方法的线程就要 block,多线程并发量大的时候会对性能有一定的影响。
3. 使用 ThreadLocal:
public class ConcurrentDateUtil {
private static ThreadLocal<DateFormat> threadLocal = new ThreadLocal<DateFormat>() {
@Override
protected DateFormat initialValue() {
return new SimpleDateFormat(“yyyy-MM-dd HH:mm:ss”);
}
};
public static Date parse(String dateStr) throws ParseException {
return threadLocal.get().parse(dateStr);
}
public static String format(Date date) {
return threadLocal.get().format(date);
}
}
  或
ThreadLocal<DateFormat>();

public static DateFormat getDateFormat()
{
DateFormat df = threadLocal.get();
if(df==null){
df = new SimpleDateFormat(date_format);
threadLocal.set(df);
}
return df;
}
public static String formatDate(Date date) throws ParseException {
return getDateFormat().format(date);
}
public static Date parse(String strDate) throws ParseException {
return getDateFormat().parse(strDate);
}
}
  说明:使用 ThreadLocal,  也是将共享变量变为独享,线程独享肯定能比方法独享在并发环境中能减少不少创建对象的开销。如果对性能要求比较高的情况下,一般推荐使用这种方法。
4. 抛弃 JDK,使用其他类库中的时间格式化类:

使用 Apache commons  里的 FastDateFormat,宣称是既快又线程安全的 SimpleDateFormat,  可惜它只能对日期进行 format,  不能对日期串进行解析。
使用 Joda-Time 类库来处理时间相关问题

  做一个简单的压力测试,方法一最慢,方法三最快,但是就算是最慢的方法一性能也不差,一般系统方法一和方法二就可以满足,所以说在这个点很难成为你系统的瓶颈所在。从简单的角度来说,建议使用方法一或者方法二,如果在必要的时候,追求那么一点性能提升的话,可以考虑用方法三,用 ThreadLocal 做缓存。
  Joda-Time 类库对时间处理方式比较完美,建议使用。
总结
  回到文章开头的问题:《有多少人在使用 Spring 框架时,很多时候不知道或者忽视了多线程的问题?》
  其实代码谁都会写,为什么架构师写的代码效果和你的天差地别呢?应该就是此类你没考虑到的小问题而架构师都考虑到了。
  架构师知识面更广,见识到的具体情况更多,解决各类问题的经验更丰富。只要你养成架构师的思维和习惯,那你离架构师还会远吗?

正文完
 0