CopyOnWriteArrayList並發容器

阿新 • • 發佈：2017-11-12

one 實現 nal clas turn 會同策略 pri 服務

CopyOnWriteArrayList並發容器

Copy-On-Write簡稱COW，是一種用於程序設計中的優化策略。其基本思路是，從一開始大家都在共享同一個內容，當某個人想要修改這個內容的時候，才會真正把內容Copy出去形成一個新的內容然後再改，這是一種延時懶惰策略。從JDK1.5開始Java並發包裏提供了兩個使用CopyOnWrite機制實現的並發容器,它們是CopyOnWriteArrayList和CopyOnWriteArraySet。CopyOnWrite容器非常有用，可以在非常多的並發場景中使用到。
什麽是CopyOnWrite容器
　　CopyOnWrite容器即寫時復制的容器。通俗的理解是當我們往一個容器添加元素的時候，不直接往當前容器添加，而是先將當前容器進行Copy，復制出一個新的容器，然後新的容器裏添加元素，添加完元素之後，再將原容器的引用指向新的容器。這樣做的好處是我們可以對CopyOnWrite容器進行並發的讀，而不需要加鎖，因為當前容器不會添加任何元素。所以CopyOnWrite容器也是一種讀寫分離的思想，讀和寫不同的容器。

CopyOnWriteArrayList的實現原理
　　在使用CopyOnWriteArrayList之前，我們先閱讀其源碼了解下它是如何實現的。以下代碼是向CopyOnWriteArrayList中add方法的實現（向CopyOnWriteArrayList裏添加元素），可以發現在添加的時候是需要加鎖的，否則多線程寫的時候會Copy出N個副本出來。

public boolean add(E e) {
 final ReentrantLock lock = this.lock;
 lock.lock();
 try {
  Object[] elements = getArray();
   
int len = elements.length;
  Object[] newElements = Arrays.copyOf(elements, len + 1);
  newElements[len] = e;
  setArray(newElements);
  return true;
 } finally {
  lock.unlock();
 }
 }

讀的時候不需要加鎖，如果讀的時候有多個線程正在向CopyOnWriteArrayList添加數據，讀還是會讀到舊的數據，因為寫的時候不會鎖住舊的CopyOnWriteArrayList。

public E get(int index) {

return get(getArray(), index);
}

JDK中並沒有提供CopyOnWriteMap，我們可以參考CopyOnWriteArrayList來實現一個，基本代碼如下：

import java.util.Collection;
import java.util.Map;
import java.util.Set;
  
public class CopyOnWriteMap<K, V> implements Map<K, V>, Cloneable {
 private volatile Map<K, V> internalMap;
  
 public CopyOnWriteMap() {
  internalMap = new HashMap<K, V>();
 }
  
 public V put(K key, V value) {
  
  synchronized (this) {
   Map<K, V> newMap = new HashMap<K, V>(internalMap);
   V val = newMap.put(key, value);
   internalMap = newMap;
   return val;
  }
 }
  
 public V get(Object key) {
  return internalMap.get(key);
 }
  
 public void putAll(Map<? extends K, ? extends V> newData) {
  synchronized (this) {
   Map<K, V> newMap = new HashMap<K, V>(internalMap);
   newMap.putAll(newData);
   internalMap = newMap;
  }
 }
}

　實現很簡單，只要了解了CopyOnWrite機制，我們可以實現各種CopyOnWrite容器，並且在不同的應用場景中使用。
CopyOnWrite的應用場景
　　CopyOnWrite並發容器用於讀多寫少的並發場景。比如白名單，黑名單，商品類目的訪問和更新場景，假如我們有一個搜索網站，用戶在這個網站的搜索框中，輸入關鍵字搜索內容，但是某些關鍵字不允許被搜索。這些不能被搜索的關鍵字會被放在一個黑名單當中，黑名單每天晚上更新一次。當用戶搜索時，會檢查當前關鍵字在不在黑名單當中，如果在，則提示不能搜索。實現代碼如下：

package com.ifeve.book;
  
import java.util.Map;
  
import com.ifeve.book.forkjoin.CopyOnWriteMap;
  
/**
 * 黑名單服務
 *
 * @author fangtengfei
 *
 */
public class BlackListServiceImpl {
  
 private static CopyOnWriteMap<String, Boolean> blackListMap = new CopyOnWriteMap<String, Boolean>(
   1000);
  
 public static boolean isBlackList(String id) {
  return blackListMap.get(id) == null ? false : true;
 }
  
 public static void addBlackList(String id) {
  blackListMap.put(id, Boolean.TRUE);
 }
  
 /**
  * 批量添加黑名單
  *
  * @param ids
  */
 public static void addBlackList(Map<String,Boolean> ids) {
  blackListMap.putAll(ids);
 }
  
}

代碼很簡單，但是使用CopyOnWriteMap需要註意兩件事情：
　　1. 減少擴容開銷。根據實際需要，初始化CopyOnWriteMap的大小，避免寫時CopyOnWriteMap擴容的開銷。
　　2. 使用批量添加。因為每次添加，容器每次都會進行復制，所以減少添加次數，可以減少容器的復制次數。如使用上面代碼裏的addBlackList方法。
CopyOnWrite的缺點
　　CopyOnWrite容器有很多優點，但是同時也存在兩個問題，即內存占用問題和數據一致性問題。所以在開發的時候需要註意一下。
　　內存占用問題。因為CopyOnWrite的寫時復制機制，所以在進行寫操作的時候，內存裏會同時駐紮兩個對象的內存，舊的對象和新寫入的對象（註意:在復制的時候只是復制容器裏的引用，只是在寫的時候會創建新對象添加到新容器裏，而舊容器的對象還在使用，所以有兩份對象內存）。如果這些對象占用的內存比較大，比如說200M左右，那麽再寫入100M數據進去，內存就會占用300M，那麽這個時候很有可能造成頻繁的Yong GC和Full GC。之前我們系統中使用了一個服務由於每晚使用CopyOnWrite機制更新大對象，造成了每晚15秒的Full GC，應用響應時間也隨之變長。
　　針對內存占用問題，可以通過壓縮容器中的元素的方法來減少大對象的內存消耗，比如，如果元素全是10進制的數字，可以考慮把它壓縮成36進制或64進制。或者不使用CopyOnWrite容器，而使用其他的並發容器，如ConcurrentHashMap。
　　數據一致性問題。CopyOnWrite容器只能保證數據的最終一致性，不能保證數據的實時一致性。所以如果你希望寫入的的數據，馬上能讀到，請不要使用CopyOnWrite容器。

CopyOnWriteArrayList並發容器

one 實現 nal clas turn 會同策略 pri 服務 CopyOnWriteArrayList並發容器 Copy-On-Write簡稱COW，是一種用於程序設計中的優化策略。其基本思路是，從一開始大家都在共享同一個內容，當某個人想要修改這個內容的時候，才會真

CopyOnWriteArrayList並發容器