1. 程式人生 > 程式設計 >ThreadLocal 深度解析

ThreadLocal 深度解析

一.對ThreadLocal的理解 二.深入解析ThreadLocal類 三.ThreadLocal的應用場景

對ThreadLocal的理解

ThreadLocal是一個本地執行緒副本變數工具類。主要用於將私有執行緒和該執行緒存放的副本物件做一個對映,各個執行緒之間的變數互不幹擾,在高併發場景下,可以實現無狀態的呼叫,特別適用於各個執行緒依賴不同的變數值完成操作的場景。

我們先寫一個例子

class ConnectionManager {
     
    private static Connection connect = null;
     
    public static Connection openConnection
() { if(connect == null){ connect = DriverManager.getConnection(); } return connect; } public static void closeConnection() { if(connect!=null) connect.close(); } } 複製程式碼

假設有這樣一個資料庫連結管理類,這段程式碼在單執行緒中使用是沒有任何問題的,但是如果在多執行緒中使用呢?很顯然,在多執行緒中使用會存線上程安全問題:第一,這裡面的2個方法都沒有進行同步,很可能在openConnection方法中會多次建立connect;第二,由於connect是共享變數,那麼必然在呼叫connect的地方需要使用到同步來保障執行緒安全,因為很可能一個執行緒在使用connect進行資料庫操作,而另外一個執行緒呼叫closeConnection關閉連結。

所以出於執行緒安全的考慮,必須將這段程式碼的兩個方法進行同步處理,並且在呼叫connect的地方需要進行同步處理。

這樣將會大大影響程式執行效率,因為一個執行緒在使用connect進行資料庫操作的時候,其他執行緒只有等待。

那麼大家來仔細分析一下這個問題,這地方到底需不需要將connect變數進行共享?事實上,是不需要的。假如每個執行緒中都有一個connect變數,各個執行緒之間對connect變數的訪問實際上是沒有依賴關係的,即一個執行緒不需要關心其他執行緒是否對這個connect進行了修改的。

到這裡,可能會有朋友想到,既然不需要線上程之間共享這個變數,可以直接這樣處理,在每個需要使用資料庫連線的方法中具體使用時才建立資料庫連結,然後在方法呼叫完畢再釋放這個連線。比如下面這樣:

class ConnectionManager {
     
    private  Connection connect = null;
     
    public Connection openConnection() {
        if(connect == null){
            connect = DriverManager.getConnection();
        }
        return connect;
    }
     
    public void closeConnection() {
        if(connect!=null)
            connect.close();
    }
}
 
 
class Dao{
    public void insert() {
        ConnectionManager connectionManager = new ConnectionManager();
        Connection connection = connectionManager.openConnection();
         
        //使用connection進行操作
         
        connectionManager.closeConnection();
    }
}
複製程式碼

這樣處理確實也沒有任何問題,由於每次都是在方法內部建立的連線,那麼執行緒之間自然不存線上程安全問題。由於在方法中需要頻繁地開啟和關閉資料庫連線,這樣會導致伺服器壓力非常大,嚴重影響程式執行效能。

這種情況下我們可以使用ThreadLocal,因為ThreadLocal在每個執行緒中對該變數會建立一個副本,即每個執行緒內部都會有一個該變數,且線上程內部任何地方都可以使用,執行緒之間互不影響,這樣一來就不存線上程安全問題,也不會嚴重影響程式執行效能。

但是要注意,雖然ThreadLocal能夠解決上面說的問題,但是由於在每個執行緒中都建立了副本,所以要考慮它對資源的消耗,比如記憶體的佔用會比不使用ThreadLocal要大。

下圖為ThreadLocal的內部結構圖

image

從上面的結構圖,我們已經窺見ThreadLocal的核心機制:

  • 每個Thread執行緒內部都有一個Map。
  • Map裡面儲存執行緒本地物件(key)和執行緒的變數副本(value)
  • 但是,Thread內部的Map是由ThreadLocal維護的,由ThreadLocal負責向map獲取和設定執行緒的變數值。

所以對於不同的執行緒,每次獲取副本值時,別的執行緒並不能獲取到當前執行緒的副本值,形成了副本的隔離,互不幹擾。

.深入解析ThreadLocal類

Thread執行緒內部的Map在類中描述如下:

public class Thread implements Runnable {
    /* ThreadLocal values pertaining to this thread. This map is maintained
     * by the ThreadLocal class. */
    ThreadLocal.ThreadLocalMap threadLocals = null;
}

複製程式碼

我們先了解一下ThreadLocal類提供如下幾個核心方法:

public T get() { }
public void set(T value) { }
public void remove() { }
protected T initialValue() { }
複製程式碼
  • get()方法用於獲取當前執行緒的副本變數值。
  • set()方法用於設定當前執行緒的副本變數值。
  • initialValue()為當前執行緒初始副本變數值。
  • remove()方法移除當前前程的副本變數值。

先看下get方法的實現:

/**
 * Returns the value in the current thread's copy of this
 * thread-local variable.  If the variable has no value for the
 * current thread,it is first initialized to the value returned
 * by an invocation of the {@link #initialValue} method.
 *
 * @return the current thread's value of this thread-local
 */
public T get() {
    Thread t = Thread.currentThread();
    ThreadLocalMap map = getMap(t);
    if (map != null) {
        ThreadLocalMap.Entry e = map.getEntry(this);
        if (e != null)
            return (T)e.value;
    }
    return setInitialValue();
}
複製程式碼

第一句是取得當前執行緒,然後通過getMap(t)方法獲取到一個map,map的型別為ThreadLocalMap。然後接著下面獲取到<key,value>鍵值對,注意這裡獲取鍵值對傳進去的是 this,而不是當前執行緒t。 如果獲取成功,則返回value值。 如果map為空,則呼叫setInitialValue方法返回value。 我們上面的每一句來仔細分析: 首先看一下getMap方法中做了什麼:

ThreadLocalMap getMap(Thread t) {
    return t.threadLocals;
}
複製程式碼

可能大家沒有想到的是,在getMap中,是呼叫當期執行緒t,返回當前執行緒t中的一個成員變數threadLocals。 那麼我們繼續取Thread類中取看一下成員變數threadLocals是什麼:

ThreadLocal.ThreadLocalMap threadLocals = null;
複製程式碼

實際上就是一個ThreadLocalMap,這個型別是ThreadLocal類的一個內部類,我們繼續取看ThreadLocalMap的實現:

 static class ThreadLocalMap {

        /**
         * The entries in this hash map extend WeakReference,using
         * its main ref field as the key (which is always a
         * ThreadLocal object).  Note that null keys (i.e. entry.get()
         * == null) mean that the key is no longer referenced,so the
         * entry can be expunged from table.  Such entries are referred to
         * as "stale entries" in the code that follows.
         */
        static class Entry extends WeakReference<ThreadLocal<?>> {
            /** The value associated with this ThreadLocal. */
            Object value;

            Entry(ThreadLocal<?> k,Object v) {
                super(k);
                value = v;
            }
        }
複製程式碼

可以看到ThreadLocalMap的Entry繼承了WeakReference,並且使用ThreadLocal作為鍵值。 然後再繼續看setInitialValue方法的具體實現:

private T setInitialValue() {
    T value = initialValue();
    Thread t = Thread.currentThread();
    ThreadLocalMap map = getMap(t);
    if (map != null)
        map.set(this,value);
    else
        createMap(t,value);
    return value;
}

protected T initialValue() {
    return null;
}

複製程式碼

 如果map不為空,設定鍵值對為空,再建立Map,看一下createMap的實現:

  /**
     * Create the map associated with a ThreadLocal. Overridden in
     * InheritableThreadLocal.
     *
     * @param t the current thread
     * @param firstValue value for the initial entry of the map
     */
    void createMap(Thread t,T firstValue) {
        t.threadLocals = new ThreadLocalMap(this,firstValue);
    }
複製程式碼

ThreadLocal為每個執行緒建立變數的副本的過程:

首先,在每個執行緒Thread內部有一個ThreadLocal.ThreadLocalMap型別的成員變數threadLocals,這個threadLocals就是用來儲存實際的變數副本的,鍵值為當前ThreadLocal變數,value為變數副本(即T型別的變數)。

初始時,在Thread裡面,threadLocals為空,當通過ThreadLocal變數呼叫get()方法或者set()方法,就會對Thread類中的threadLocals進行初始化,並且以當前ThreadLocal變數為鍵值,以ThreadLocal要儲存的副本變數為value,存到threadLocals。

然後在當前執行緒裡面,如果要使用副本變數,就可以通過get方法在threadLocals裡面查詢。

下面通過一個例子來證明通過ThreadLocal能達到在每個執行緒中建立變數副本的效果:

public class Test {
    ThreadLocal<Long> longLocal = new ThreadLocal<Long>();
    ThreadLocal<String> stringLocal = new ThreadLocal<String>();
     
    public void set() {
        longLocal.set(Thread.currentThread().getId());
        stringLocal.set(Thread.currentThread().getName());
    }
     
    public long getLong() {
        return longLocal.get();
    }
     
    public String getString() {
        return stringLocal.get();
    }
     
    public static void main(String[] args) throws InterruptedException {
        final Test test = new Test();
        test.set();
        System.out.println(test.getLong());
        System.out.println(test.getString());
   
        Thread thread1 = new Thread(){
            public void run() {
                test.set();
                System.out.println(test.getLong());
                System.out.println(test.getString());
            };
        };
        thread1.start();
        thread1.join();
         
        System.out.println(test.getLong());
        System.out.println(test.getString());
    }
}

複製程式碼

輸出結果如下圖

圖片.png

從這段程式碼的輸出結果可以看出,在main執行緒中和thread1執行緒中,longLocal儲存的副本值和stringLocal儲存的副本值都不一樣。最後一次在main執行緒再次列印副本值是為了證明在main執行緒中和thread1執行緒中的副本值確實是不同的。

總結一下:

1)實際的通過ThreadLocal建立的副本是儲存在每個執行緒自己的threadLocals中的; 2)為何threadLocals的型別ThreadLocalMap的鍵值為ThreadLocal物件,因為每個執行緒中可有多個threadLocal變數,就像上面程式碼中的longLocal和stringLocal; 3)在進行get之前,必須先set,否則會報空指標異常;

如果想在get之前不需要呼叫set就能正常訪問的話,必須重寫initialValue()方法。 因為在上面的程式碼分析過程中,我們發現如果沒有先set的話,即在map中查詢不到對應的儲存,則會通過呼叫setInitialValue方法返回i,而在setInitialValue方法中,有一個語句是T value = initialValue(), 而預設情況下,initialValue方法返回的是null。

看下面這個例子:

public class Test {
    ThreadLocal<Long> longLocal = new ThreadLocal<Long>();
    ThreadLocal<String> stringLocal = new ThreadLocal<String>();
 
    public void set() {
        longLocal.set(Thread.currentThread().getId());
        stringLocal.set(Thread.currentThread().getName());
    }
     
    public long getLong() {
        return longLocal.get();
    }
     
    public String getString() {
        return stringLocal.get();
    }
     
    public static void main(String[] args) throws InterruptedException {
        final Test test = new Test();
         
        System.out.println(test.getLong());
        System.out.println(test.getString());
 
        Thread thread1 = new Thread(){
            public void run() {
                test.set();
                System.out.println(test.getLong());
                System.out.println(test.getString());
            };
        };
        thread1.start();
        thread1.join();
         
        System.out.println(test.getLong());
        System.out.println(test.getString());
    }
}
複製程式碼

在main執行緒中,沒有先set,直接get的話,執行時會報空指標異常。 但是如果改成下面這段程式碼,即重寫了initialValue方法:

public class Test {
    ThreadLocal<Long> longLocal = new ThreadLocal<Long>(){
        protected Long initialValue() {
            return Thread.currentThread().getId();
        };
    };
    ThreadLocal<String> stringLocal = new ThreadLocal<String>(){;
        protected String initialValue() {
            return Thread.currentThread().getName();
        };
    };
     
    public void set() {
        longLocal.set(Thread.currentThread().getId());
        stringLocal.set(Thread.currentThread().getName());
    }
     
    public long getLong() {
        return longLocal.get();
    }
     
    public String getString() {
        return stringLocal.get();
    }
     
    public static void main(String[] args) throws InterruptedException {
        final Test test = new Test();
 
        test.set();
        System.out.println(test.getLong());
        System.out.println(test.getString());
     
         
        Thread thread1 = new Thread(){
            public void run() {
                test.set();
                System.out.println(test.getLong());
                System.out.println(test.getString());
            };
        };
        thread1.start();
        thread1.join();
         
        System.out.println(test.getLong());
        System.out.println(test.getString());
    }
}
複製程式碼

就可以直接不用先set而直接呼叫get了。

set()方法

/**
 * Sets the current thread's copy of this thread-local variable
 * to the specified value.  Most subclasses will have no need to
 * override this method,relying solely on the {@link #initialValue}
 * method to set the values of thread-locals.
 *
 * @param value the value to be stored in the current thread's copy of
 *        this thread-local.
 */
public void set(T value) {
    Thread t = Thread.currentThread();
    ThreadLocalMap map = getMap(t);
    if (map != null)
        map.set(this,value);
}

ThreadLocalMap getMap(Thread t) {
    return t.threadLocals;
}

void createMap(Thread t,T firstValue) {
    t.threadLocals = new ThreadLocalMap(this,firstValue);
}

複製程式碼

set方法過程: 1.獲取當前執行緒的成員變數map 2.map非空,則重新將ThreadLocal和新的value副本放入到map中。 3.map空,則對執行緒的成員變數ThreadLocalMap進行初始化建立,並將ThreadLocal和value副本放入map中。

remove()方法

/**
 * Removes the current thread's value for this thread-local
 * variable.  If this thread-local variable is subsequently
 * {@linkplain #get read} by the current thread,its value will be
 * reinitialized by invoking its {@link #initialValue} method,* unless its value is {@linkplain #set set} by the current thread
 * in the interim.  This may result in multiple invocations of the
 * <tt>initialValue</tt> method in the current thread.
 *
 * @since 1.5
 */
public void remove() {
 ThreadLocalMap m = getMap(Thread.currentThread());
 if (m != null)
     m.remove(this);
}

ThreadLocalMap getMap(Thread t) {
    return t.threadLocals;
}

複製程式碼

ThreadLocalMap

ThreadLocalMap是ThreadLocal的內部類,沒有實現Map介面,用獨立的方式實現了Map的功能,其內部的Entry也獨立實現。

image

在ThreadLocalMap中,也是用Entry來儲存K-V結構資料的。但是Entry中key只能是ThreadLocal物件,這點被Entry的構造方法已經限定死了。

static class Entry extends WeakReference<ThreadLocal> {
    /** The value associated with this ThreadLocal. */
    Object value;

    Entry(ThreadLocal k,Object v) {
        super(k);
        value = v;
    }
}

複製程式碼

Entry繼承自WeakReference(弱引用,生命週期只能存活到下次GC前),但只有Key是弱引用型別的,Value並非弱引用。

ThreadLocalMap的成員變數:

static class ThreadLocalMap {
    /**
     * The initial capacity -- MUST be a power of two.
     */
    private static final int INITIAL_CAPACITY = 16;

    /**
     * The table,resized as necessary.
     * table.length MUST always be a power of two.
     */
    private Entry[] table;

    /**
     * The number of entries in the table.
     */
    private int size = 0;

    /**
     * The next size value at which to resize.
     */
    private int threshold; // Default to 0
}

複製程式碼

Hash衝突怎麼解決

和HashMap的最大的不同在於,ThreadLocalMap結構非常簡單,沒有next引用,也就是說ThreadLocalMap中解決Hash衝突的方式並非連結串列的方式,而是採用線性探測的方式,所謂線性探測,就是根據初始key的hashcode值確定元素在table陣列中的位置,如果發現這個位置上已經有其他key值的元素被佔用,則利用固定的演演算法尋找一定步長的下個位置,依次判斷,直至找到能夠存放的位置。

ThreadLocalMap解決Hash衝突的方式就是簡單的步長加1或減1,尋找下一個相鄰的位置。

/**
 * Increment i modulo len.
 */
private static int nextIndex(int i,int len) {
    return ((i + 1 < len) ? i + 1 : 0);
}

/**
 * Decrement i modulo len.
 */
private static int prevIndex(int i,int len) {
    return ((i - 1 >= 0) ? i - 1 : len - 1);
}

複製程式碼

顯然ThreadLocalMap採用線性探測的方式解決Hash衝突的效率很低,如果有大量不同的ThreadLocal物件放入map中時傳送衝突,或者發生二次衝突,則效率很低。

所以這裡引出的良好建議是:每個執行緒只存一個變數,這樣的話所有的執行緒存放到map中的Key都是相同的ThreadLocal,如果一個執行緒要儲存多個變數,就需要建立多個ThreadLocal,多個ThreadLocal放入Map中時會極大的增加Hash衝突的可能。

ThreadLocalMap的問題

由於ThreadLocalMap的key是弱引用,而Value是強引用。這就導致了一個問題,ThreadLocal在沒有外部物件強引用時,發生GC時弱引用Key會被回收,而Value不會回收,如果建立ThreadLocal的執行緒一直持續執行,那麼這個Entry物件中的value就有可能一直得不到回收,發生記憶體洩露。

如何避免洩漏 既然Key是弱引用,那麼我們要做的事,就是在呼叫ThreadLocal的get()、set()方法時完成後再呼叫remove方法,將Entry節點和Map的引用關係移除,這樣整個Entry物件在GC Roots分析後就變成不可達了,下次GC的時候就可以被回收。

如果使用ThreadLocal的set方法之後,沒有顯示的呼叫remove方法,就有可能發生記憶體洩露,所以養成良好的程式設計習慣十分重要,使用完ThreadLocal之後,記得呼叫remove方法。

ThreadLocal<Session> threadLocal = new ThreadLocal<Session>();
try {
    threadLocal.set(new Session(1,"Misout的部落格"));
    // 其它業務邏輯
} finally {
    threadLocal.remove();
}

複製程式碼

三.ThreadLocal的應用場景

最常見的ThreadLocal使用場景為 用來解決 資料庫連線、Session管理等。

private static ThreadLocal<Connection> connectionHolder
= new ThreadLocal<Connection>() {
public Connection initialValue() {
    return DriverManager.getConnection(DB_URL);
}
};
 
public static Connection getConnection() {
return connectionHolder.get();
}
複製程式碼
private static final ThreadLocal<Session> threadLocal = new ThreadLocal<Session>();

//獲取Session
public static Session getCurrentSession(){
    Session session =  threadLocal.get();
    //判斷Session是否為空,如果為空,將建立一個session,並設定到本地執行緒變數中
    try {
        if(session ==null&&!session.isOpen()){
            if(sessionFactory==null){
                rbuildSessionFactory();// 建立Hibernate的SessionFactory
            }else{
                session = sessionFactory.openSession();
            }
        }
        threadLocal.set(session);
    } catch (Exception e) {
        // TODO: handle exception
    }

    return session;
}

複製程式碼
private static final ThreadLocal threadSession = new ThreadLocal();
 
public static Session getSession() throws InfrastructureException {
    Session s = (Session) threadSession.get();
    try {
        if (s == null) {
            s = getSessionFactory().openSession();
            threadSession.set(s);
        }
    } catch (HibernateException ex) {
        throw new InfrastructureException(ex);
    }
    return s;
}
複製程式碼

每個執行緒訪問資料庫都應當是一個獨立的Session會話,如果多個執行緒共享同一個Session會話,有可能其他執行緒關閉連線了,當前執行緒再執行提交時就會出現會話已關閉的異常,導致系統異常。此方式能避免執行緒爭搶Session,提高併發下的安全性。

使用ThreadLocal的典型場景正如上面的資料庫連線管理,執行緒會話管理等場景,只適用於獨立變數副本的情況,如果變數為全域性共享的,則不適用在高併發下使用。

總結

  • 每個ThreadLocal只能儲存一個變數副本,如果想要一個執行緒能夠儲存多個副本,就需要建立多個ThreadLocal。
  • ThreadLocal內部的ThreadLocalMap鍵為弱引用,會有記憶體洩漏的風險。
  • 適用於無狀態,副本變數獨立後不影響業務邏輯的高併發場景。如果如果業務邏輯強依賴於副本變數,則不適合用ThreadLocal解決,需要另尋解決方案。