深入理解React：diff 演算法

阿新 • • 發佈：2020-07-05

**目錄** - 序言 - React 的核心思想 - 傳統 diff 演算法 - React diff - 兩個假設 - 三個策略 - diff 具體優化 - tree diff - component diff - element diff - 小結 - 參考
**1.序言** 此篇文章所討論的是 React 16 以前的 Diff 演算法。而 React 16 啟用了全新的架構 Fiber，相應的 Diff 演算法也有所改變，不在這篇文章的討論範圍內。研究 React 的 Diff 演算法重在理解其思想，具體實現其次。
**2.React 的核心思想** React 最為核心的就是 Virtual DOM 和 Diff 演算法。React 在記憶體中維護一顆虛擬 DOM 樹，當資料發生改變時（state & props），會自動的更新虛擬 DOM，獲得一個新的虛擬 DOM 樹，然後通過 Diff 演算法，比較新舊虛擬 DOM 樹，找出最小的有變化的部分，將這個變化的部分（Patch）加入佇列，最終批量的更新這些 Patch 到實際的 DOM 中。
**3.傳統 diff 演算法** 將一顆 Tree 通過最小操作步數對映為另一顆 Tree，這種演算法稱之為 Tree Edit Distance（樹編輯距離）。如圖： ![](https://img2020.cnblogs.com/blog/898684/202007/898684-20200705172955301-524308004.png) 上圖中，最小操作步數（編輯距離）為 3： 1. 刪除 ul 節點 2. 新增 span 節點 3. 新增 text 節點
而 Tree Edit Distance 演算法從 1979 年到 2011年，經過了30多年的發展演變，其時間複雜度最終被優化到 O(n^3)，其發展歷程大致如下（n 是樹中節點的總數）： > 1. 1979年，Tai 提出了次個非冪級複雜度演算法，時間複雜度為 O(m^3*n^3) > 2. 1989年，Zhang and Shasha 將 Tai 的演算法進行優化，時間複雜度為 O(m^2*n^2) > 3. 1998年，Klein 將 Zhang and Shasha 的演算法再次優化，時間複雜度為 O(n^2\*m\*log(m)) > 4. 2009年，Demiane 提出最壞情況下的計算公式，將時間複雜度控制在 O(n^2\*m\*(1+log(m/n))) > 5. 2011年，Pawlik and N.Augsten 提出適用於所有形狀的樹的演算法，並將時間複雜度控制在 O(n^3)
這裡不會展開討論 Tree Edit Distance 演算法的具體實現和原理，有興趣可以直接看這篇論文 [A Robust Algorithm for the Tree Edit Distance](http://vldb.org/pvldb/vol5/p334_mateuszpawlik_vldb2012.pdf)
**4.React diff** 傳統 diff 演算法其時間複雜度最優解是 O(n^3)，那麼如果有 1000 個節點，則一次 diff 就將進行 10 億次比較，這顯然無法達到高效能的要求。而 React 通過大膽的假設，並基於假設提出相關策略，成功的將 O(n^3) 複雜度的問題轉化為 O(n) 複雜度的問題。
**（1）兩個假設** 為了優化 diff 演算法，React 提出了兩個假設： 1. 兩個不同型別的元素會產生出不同的樹 2. 開發者可以通過 `key` prop 來暗示哪些子元素在不同的渲染下能保持穩定
**（2）三個策略** 基於這上述兩個假設，React 針對性的提出了三個策略以對 diff 演算法進行優化： 1. Web UI 中 DOM 節點跨層級的移動操作特別少，可以忽略不計 2. 擁有相同型別的兩個元件將會生成相似的樹形結構，擁有不同型別的兩個元件將會生成不同樹形結構 3. 對於同一層級的一組子節點，它們可以通過唯一 key 進行區分
**（3）diff 具體優化** 基於上述三個策略，React 分別對以下三個部分進行了 diff 演算法優化 - tree diff - component diff - element diff
**tree diff** React 只對虛擬 DOM 樹進行分層比較，不考慮節點的跨層級比較。如下圖： ![分層比較](https://img2020.cnblogs.com/blog/898684/202007/898684-20200705173015426-2063874687.png) 如上圖，React 通過 updateDepth 對虛擬 Dom 樹進行層級控制，只會對相同顏色框內的節點進行比較，根據對比結果，進行節點的新增和刪除。如此只需要遍歷一次虛擬 Dom 樹，就可以完成整個的對比。
如果發生了跨層級的移動操作，如下圖： ![跨層級的移動操作](https://img2020.cnblogs.com/blog/898684/202007/898684-20200705173026947-801165920.png) 通過分層比較可知，React 並不會複用 B 節點及其子節點，而是會直接刪除 A 節點下的 B 節點，然後再在 C 節點下建立新的 B 節點及其子節點。因此，如果發生跨級操作，React 是不能複用已有節點，可能會導致 React 進行大量重新建立操作，這會影響效能。所以 React 官方推薦儘量避免跨層級的操作。
**component diff** React 是基於元件構建的，對於元件間的比較所採用的策略如下： - 如果是同類型元件，首先使用 `shouldComponentUpdate()`方法判斷是否需要進行比較，如果返回`true`，才比較對應的虛擬 DOM 節點，否則不需要比較 - 如果是不同型別的元件，則將該元件判斷為 dirty component，從而替換整個元件下的所有子節點
![不同型別的元件比較](https://img2020.cnblogs.com/blog/898684/202007/898684-20200705173038613-507986139.png) 如上圖，雖然元件 C 和元件 H 結構相似，但型別不同，React 不會進行比較，會直接刪除元件 C，建立元件 H。
從上述 component diff 策略可以知道： 1. 對於不同型別的元件，預設不需要進行比較操作，直接重新建立。 2. 對於同類型元件，通過讓開發人員自定義`shouldComponentUpdate()`方法來進行比較優化，減少元件不必要的比較。如果沒有自定義，`shouldComponentUpdate()`方法預設返回`true`，預設每次元件發生資料（state & props）變化時，都會進行比較。
**element diff** element diff 涉及三種操作：移動、建立、刪除。對於同一層級的子節點，對於是否使用 key 分別進行討論。
對於不使用 key 的情況，如下圖： ![不使用 key 的情況](https://img2020.cnblogs.com/blog/898684/202007/898684-20200705173102635-1532111616.png) React 對新老同一層級的子節點對比，發現新集合中的 B 不等於老集合中的 A，於是刪除 A，建立 B，依此類推，直到刪除 D，建立 C。這會使得相同的節點不能複用，出現頻繁的刪除和建立操作，從而影響效能。
對於使用 key 的情況，如下圖： ![使用 key 的情況](https://img2020.cnblogs.com/blog/898684/202007/898684-20200705173113504-215799162.png) React 首先會對新集合進行遍歷，通過唯一 key 來判斷老集合中是否存在相同的節點，如果沒有則建立，如果有的，則判斷是否需要進行移動操作。並且 React 對於移動操作也採用了比較高效的演算法，使用了一種順序優化手段，這裡不做詳細討論。
從上述可知，element diff 就是通過唯一 key 來進行 diff 優化，通過複用已有的節點，減少節點的刪除和建立操作。
**5.小結** React 通過大膽的假設，制定對應的 diff 策略，將 O(n3) 複雜度的問題轉換成 O(n) 複雜度的問題 - 通過分層對比策略，對 tree diff 進行演算法優化 - 通過相同類生成相似樹形結構，不同類生成不同樹形結構以及`shouldComponentUpdate`策略，對 component diff 進行演算法優化 - 通過設定唯一 key 策略，對 element diff 進行演算法優化
**6.參考** [React - 協調](https://zh-hans.reactjs.org/docs/reconciliation.html) [Deep In React之淺談 React Fiber 架構(一)](https://juejin.im/post/5d12c907f265da1b6d4033c5) [react16的diff演算法相比於react15有什麼改動？](https://www.zhihu.com/question/266800762) [React 原始碼剖析系列－不可思議的 react diff](https://zhuanlan.zhihu.com/p/20346379) [傳統diff演算法的演算法複雜度為什麼是o(n3)?](https://www.zhihu.com/question/66851503/answer/246

深入理解React：diff 演算法

深入理解React：diff 演算法

深入理解React：懶載入（lazy）實現原理

深入理解React：事件機制原理

深入理解React 之 Virtual DOM & Diff Algorithm

深入理解JVM：HotSpot虛擬機對象探秘

深入理解JVM：JVM執行時數據區域分類

深入理解Java：類加載機制及反射

深入理解JVM：垃圾收集器與內存分配策略

深入理解Java：註解（Annotation）--註解處理器

深入理解Java：註解

深入理解react-router 路由的實現原理

深入理解JVM之GC演算法與垃圾收集器[轉]

分散式系統的架構思路深入理解java：5. Java分散式架構

React node diff演算法學習

深入理解Nginx：模組開發與架構解析

【深度學習】深入理解優化器Optimizer演算法（BGD、SGD、MBGD、Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam）

PyTorch基礎系列（三）——深入理解autograd：Variable屬性方法【最新已經和tensor合併為一類】

深入理解java：執行緒本地變數 java.lang.ThreadLocal類

深入理解OkHttp3：（三）連線（Connections）

深入理解Java：SimpleDateFormat安全的時間格式化

深入理解React：diff 演算法

相關推薦