追踪解析 ThreadLocal 源码

7次阅读

共计 5578 个字符,预计需要花费 14 分钟才能阅读完成。

零 前期准备
0 FBI WARNING
文章异常啰嗦且绕弯。
1 版本
JDK 版本 : OpenJDK 11.0.1
IDE : idea 2018.3
2 ThreadLocal 简介
ThreadLocal 是 java 多线程中经常使用到的缓存工具,被封装在 java.lang 包下。
3 Demo
import io.netty.util.concurrent.FastThreadLocal;

public class ThreadLocalDemo {

public static void main(String[] args) {

//jdk 的 ThreadLocal
ThreadLocal<String> tl = new ThreadLocal<>();
long tlBeginTime = System.nanoTime();
//set(…) 方法存入元素
tl.set(“test”);
//get() 方法获取元素
String get = tl.get();
System.out.println(“tl before remove: ” + get);
//remove() 方法删除元素
tl.remove();
get = tl.get();
System.out.println(“tl after remove: ” + get);
System.out.println(System.nanoTime() – tlBeginTime);

// 以下代码为著名 io 框架 Netty 的 FastThreadLocal 类的使用
//FastThreadLocal,基本的使用方法和 ThreadLocal 没有区别
//FastThreadLocal 的实例对象创建比较慢,但是元素的获取、增、删的性能很好
FastThreadLocal<String> fastTl = new FastThreadLocal<>();
long fastTlBeginTime = System.nanoTime();
fastTl.set(“test”);
String fastGet = fastTl.get();
System.out.println(“tl2 before remove: ” + fastGet);
fastTl.remove();
fastGet = fastTl.get();
System.out.println(“tl2 after remove: ” + fastGet);
System.out.println(System.nanoTime() – fastTlBeginTime);

// 此处的 Netty 使用 4.1.33.Final 的版本
// 笔者跑了一下,FastThreadLocal 的增删查操作大概比 ThreadLocal 快十倍
// 但是此处仅为简陋测试,并不严谨
}
}
FastThreadLocal 的源码暂不展开,将来有机会单独开一章去学习。这里先理解 ThreadLocal。
一 ThreadLocalMap
在了解 ThreadLocal 的全貌之前先来理解一下 ThreadLocalMap 类。
其为 ThreadLocal 的静态内部类。虽然类名中带有 map 字样,但是实际上并不是 Map 接口的子类。
ThreadLocalMap 本质上是数组。每个 Thread 实例对象都会维护多个 ThreadLocalMap 对象:
ThreadLocal.ThreadLocalMap threadLocals = null;
ThreadLocal.ThreadLocalMap inheritableThreadLocals = null;
但是需要注意的是,在默认情况下,线程对象的 ThreadLocalMap 对象们都是未初始化的,需要使用 createMap(…) 方法去初始化:
//ThreadLocal.class
void createMap(Thread t, T firstValue) {
// 此处 ThreadLocal 将自身作为 key 值存入了 map 中
t.threadLocals = new ThreadLocalMap(this, firstValue);
}
可以想到的是,此处是为了提高线程的性能,而设计了一个懒加载 (Lazy) 的调用模式。
[但是实际上这是理想情况,对于主线程来说,Collections、StringCoding 等的工具类在 jdk 加载时期就会调用 ThreadLocal,所以 ThreadLocalMap 肯定会被创建好]
再来看一下 ThreadLocalMap 的构造方法:
//ThreadLocalMap.class
ThreadLocalMap(ThreadLocal<?> firstKey, Object firstValue) {
//Entry 是 ThreadLocalMap 的静态内部类,代表节点的对象
//table 是一个 Entry 数组,代表链表
table = new Entry[INITIAL_CAPACITY];
// 这里调用 key 的 hash 值进行数组下标计算
//INITIAL_CAPACITY 为常量 16
int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY – 1);
table[i] = new Entry(firstKey, firstValue);
size = 1;
//threshold = INITIAL_CAPACITY * 2 / 3
setThreshold(INITIAL_CAPACITY);
}
Entry
Entry 是 ThreadLocalMap 的静态内部类,本质上是数组的节点 value 的封装:
static class Entry extends WeakReference<ThreadLocal<?>> {
// 储存的 value 值
Object value;

Entry(ThreadLocal<?> k, Object v) {
// 调用父类的方法,会将 ThreadLocal 存入 Reference 中的 referent 对象中
super(k);
value = v;
}
}
由上可知 Entry 继承了 WeakReference。WeakReference 是弱连接接口,这意味着如果仅有 Entry 指向某一 ThreadLocal 类,其任然有可能被 GC 回收掉。
这里使用弱连接的意义,是为了防止业务代码中置空 ThreadLocal 对象,但是由于存在连接可达,所以仍然无法回收掉该对象的情况发生。

即可以这么说,如果使用者在业务代码中存在可达的强连接引用对象,那么 ThreadLocal 永远不会被 GC 清理掉;但是如果强连接消失了,那么弱连接并不能保证它一定存活。当然换句话说,强连接消失的时候,证明使用者已经不需要这个对象了,那么它被消灭也是应该的。
二 存入元素
来看一下 ThreadLocal 的 set(…) 方法:
//step 1
//ThreadLocal.class
public void set(T value) {
// 获取当前线程的实例对象
Thread t = Thread.currentThread();
// 通过实例对象获取到 map
//map 实际上是定义在 Thread 类中的 ThreadLocalMap 类型的对象
ThreadLocalMap map = getMap(t);
if (map != null) {
// 存入元素
map.set(this, value);
} else {
// 如果 map 不存在,会在这里创建 map
createMap(t, value);
}
}

//step 2
//ThreadLocalMap.class
private void set(ThreadLocal<?> key, Object value) {

// 获取数组 table
Entry[] tab = table;
// 获取长度
int len = tab.length;
// 根据 hash 值算出下标
int i = key.threadLocalHashCode & (len-1);

for (Entry e = tab[i];
e != null;
e = tab[i = nextIndex(i, len)]) {
//nextIndex(…) 方法获取数组的下一个下标的元素
// 基本等同于 i + 1,但是一般情况下不需要用到

// 从节点中获取 ThreadLocal 对象
ThreadLocal<?> k = e.get();

// 正常情况下 k == key,第一次存值的时候 value = null
if (k == key) {
e.value = value;
return;
}

// 正常情况下不会出现
if (k == null) {
replaceStaleEntry(key, value, i);
return;
}
}

// 进入此处语句的条件是 k 并不为 null,且 key 不等于数组内现存的所有 ThreadLocal
// 则在此处符合要求的下标处新建一个节点,并添加到 table 数组中
// 注意,这里其实是覆盖操作,会覆盖掉之前在此下标处的节点
tab[i] = new Entry(key, value);
int sz = ++size;
if (!cleanSomeSlots(i, sz) && sz >= threshold)
rehash();
}
三 获取元素
来看一下 ThreadLocal 的 get() 方法:
//step 1
//ThreadLocal.class
public T get() {
Thread t = Thread.currentThread();
ThreadLocalMap map = getMap(t);
if (map != null) {
ThreadLocalMap.Entry e = map.getEntry(this);
if (e != null) {
@SuppressWarnings(“unchecked”)
T result = (T)e.value;
return result;
}
}
//map 为 null 的情况下会进入该方法
// 此处会将 null 作为 value,当前 ThreadLocal 作为 key,传入 ThreadLocalMap 中
return setInitialValue();
}

//step 2
//ThreadLocalMap.class
private Entry getEntry(ThreadLocal<?> key) {
// 算出下标值
int i = key.threadLocalHashCode & (table.length – 1);
// 获取节点
Entry e = table[i];
if (e != null && e.get() == key)
return e;
else
// 此处会轮询整个数组去寻找,实在找不到会返回 null
return getEntryAfterMiss(key, i, e);
}
基本逻辑和 set(…) 方法差不多,不多赘述。
四 移除元素
来看一下 ThreadLocal 的 remove() 方法:
//step 1
//ThreadLocalMap.class
public void remove() {
ThreadLocalMap m = getMap(Thread.currentThread());
if (m != null) {
// 调用 ThreadLocalMap 的 remove(…) 方法
m.remove(this);
}
}

//step 2
//ThreadLocalMap.class
private void remove(ThreadLocal<?> key) {
Entry[] tab = table;
int len = tab.length;
// 算出下标
int i = key.threadLocalHashCode & (len-1);
for (Entry e = tab[i];
e != null;
e = tab[i = nextIndex(i, len)]) {
// 此处是一个和 set(…) 中很像的轮询方法
// 比对 key 值,如果相等的话会调用 clear() 方法清理掉
if (e.get() == key) {
e.clear();
// 此方法用于清理 key 值为 null 的节点
expungeStaleEntry(i);
return;
}
}
}

//step 3
//Reference.class
public void clear() {
//Reference 是 WeakReference 的父类,即也就是 Entry 的父类
// 将值置空
this.referent = null;
}
五 ThreadLocal 的 hash 值
上述方法多次使用到了用 hash 去计算数组下标的操作。如果不同 ThreadLocal 的 hash 值相同,那么就会造成计算出来的下标相同,会相互影响存入的值。
所以 ThreadLocal 的 hash 值一定不能相同。
在 ThreadLocal 中,hash 值是一个 int 类型的变量:
private final int threadLocalHashCode = nextHashCode();
其调用了静态方法 nextHashCode() 去产生 hash 值:
//ThreadLocal.class
private static int nextHashCode() {
//HASH_INCREMENT = 0x61c88647 (一个很神奇的用来解决 hash 冲突的数字)
//nextHashCode 是一个定义在 ThreadLocal 中的静态 AtomicInteger 类型变量
//getAndAdd(…) 方法会每次给 nextHashCode 的值加上 HASH_INCREMENT 的值,并返回最终的相加结果值
return nextHashCode.getAndAdd(HASH_INCREMENT);
}
jdk9 以后官方应该比较希望使用 VarHandler 类来取代 Atomic 类,所以在不久的未来,很可能相关方法会有一些变动。
六 一点唠叨
ThreadLocal 的源代码还是比较简洁的,方法封装不多,读起来不算费劲,有一些算法层面的东西比较麻烦,但是不影响阅读。
Netty 的 FastThreadLocal,其设计就要比 ThreadLocal 复杂得多,有机会再深入学习。

本文仅为个人的学习笔记,可能存在错误或者表述不清的地方,有缘补充

正文完
 0