深入理解React：diff 演演算法

阿新 • • 發佈：2020-07-05

序言
React 的核心思想
傳統 diff 演演算法
React diff
- 兩個假設
- 三個策略
- diff 具體優化
  - tree diff
  - component diff
  - element diff
小結
參考

1.序言

此篇文章所討論的是 React 16 以前的 Diff 演演算法。而 React 16 啟用了全新的架構 Fiber，相應的 Diff 演演算法也有所改變，不在這篇文章的討論範圍內。研究 React 的 Diff 演演算法重在理解其思想，具體實現其次。

2.React 的核心思想

React 最為核心的就是 Virtual DOM 和 Diff 演演算法。React 在記憶體中維護一顆虛擬 DOM 樹，當資料發生改變時（state & props），會自動的更新虛擬 DOM，獲得一個新的虛擬 DOM 樹，然後通過 Diff 演演算法，比較新舊虛擬 DOM 樹，找出最小的有變化的部分，將這個變化的部分（Patch）加入佇列，最終批量的更新這些 Patch 到實際的 DOM 中。

3.傳統 diff 演演算法

將一顆 Tree 通過最小操作步數對映為另一顆 Tree，這種演演算法稱之為 Tree Edit Distance（樹編輯距離）。如圖：

上圖中，最小操作步數（編輯距離）為 3：

刪除 ul 節點
新增 span 節點
新增 text 節點

而 Tree Edit Distance 演演算法從 1979 年到 2011年，經過了30多年的發展演變，其時間複雜度最終被優化到 O(n^3)，其發展歷程大致如下（n 是樹中節點的總數）：

1979年，Tai 提出了次個非冪級複雜度演演算法，時間複雜度為 O(m^3*n3)

1989年，Zhang and Shasha 將 Tai 的演演算法進行優化，時間複雜度為 O(m^2*n

2)

1998年，Klein 將 Zhang and Shasha 的演演算法再次優化，時間複雜度為 O(n^2*m*log(m))

2009年，Demiane 提出最壞情況下的計算公式，將時間複雜度控制在 O(n^2*m*(1+log(m/n)))

2011年，Pawlik and N.Augsten 提出適用於所有形狀的樹的演演算法，並將時間複雜度控制在 O(n^3)

這裡不會展開討論 Tree Edit Distance 演演算法的具體實現和原理，有興趣可以直接看這篇論文 A Robust Algorithm for the Tree Edit Distance

4.React diff

傳統 diff 演演算法其時間複雜度最優解是 O(n^3)，那麼如果有 1000 個節點，則一次 diff 就將進行 10 億次比較，這顯然無法達到高效能的要求。而 React 通過大膽的假設，並基於假設提出相關策略，成功的將 O(n^3) 複雜度的問題轉化為 O(n) 複雜度的問題。

（1）兩個假設

為了優化 diff 演演算法，React 提出了兩個假設：

兩個不同型別的元素會產生出不同的樹
開發者可以通過 key prop 來暗示哪些子元素在不同的渲染下能保持穩定

（2）三個策略

基於這上述兩個假設，React 針對性的提出了三個策略以對 diff 演演算法進行優化：

Web UI 中 DOM 節點跨層級的移動操作特別少，可以忽略不計
擁有相同型別的兩個元件將會生成相似的樹形結構，擁有不同型別的兩個元件將會生成不同樹形結構
對於同一層級的一組子節點，它們可以通過唯一 key 進行區分

（3）diff 具體優化

基於上述三個策略，React 分別對以下三個部分進行了 diff 演演算法優化

tree diff
component diff
element diff

tree diff

React 只對虛擬 DOM 樹進行分層比較，不考慮節點的跨層級比較。如下圖：

如上圖，React 通過 updateDepth 對虛擬 Dom 樹進行層級控制，只會對相同顏色框內的節點進行比較，根據對比結果，進行節點的新增和刪除。如此只需要遍歷一次虛擬 Dom 樹，就可以完成整個的對比。

如果發生了跨層級的移動操作，如下圖：

通過分層比較可知，React 並不會複用 B 節點及其子節點，而是會直接刪除 A 節點下的 B 節點，然後再在 C 節點下建立新的 B 節點及其子節點。因此，如果發生跨級操作，React 是不能複用已有節點，可能會導致 React 進行大量重新建立操作，這會影響效能。所以 React 官方推薦儘量避免跨層級的操作。

component diff

React 是基於元件構建的，對於元件間的比較所採用的策略如下：

如果是同型別元件，首先使用 shouldComponentUpdate()方法判斷是否需要進行比較，如果返回true，才比較對應的虛擬 DOM 節點，否則不需要比較
如果是不同型別的元件，則將該元件判斷為 dirty component，從而替換整個元件下的所有子節點

如上圖，雖然元件 C 和元件 H 結構相似，但型別不同，React 不會進行比較，會直接刪除元件 C，建立元件 H。

從上述 component diff 策略可以知道：

對於不同型別的元件，預設不需要進行比較操作，直接重新建立。
對於同型別元件，通過讓開發人員自定義shouldComponentUpdate()方法來進行比較優化，減少元件不必要的比較。如果沒有自定義，shouldComponentUpdate()方法預設返回true，預設每次元件發生資料（state & props）變化時，都會進行比較。

element diff

element diff 涉及三種操作：移動、建立、刪除。對於同一層級的子節點，對於是否使用 key 分別進行討論。

對於不使用 key 的情況，如下圖：

React 對新老同一層級的子節點對比，發現新集合中的 B 不等於老集合中的 A，於是刪除 A，建立 B，依此類推，直到刪除 D，建立 C。這會使得相同的節點不能複用，出現頻繁的刪除和建立操作，從而影響效能。

對於使用 key 的情況，如下圖：

React 首先會對新集合進行遍歷，通過唯一 key 來判斷老集合中是否存在相同的節點，如果沒有則建立，如果有的，則判斷是否需要進行移動操作。並且 React 對於移動操作也採用了比較高效的演演算法，使用了一種順序優化手段，這裡不做詳細討論。

從上述可知，element diff 就是通過唯一 key 來進行 diff 優化，通過複用已有的節點，減少節點的刪除和建立操作。

5.小結

React 通過大膽的假設，制定對應的 diff 策略，將 O(n3) 複雜度的問題轉換成 O(n) 複雜度的問題

通過分層對比策略，對 tree diff 進行演演算法優化
通過相同類生成相似樹形結構，不同類生成不同樹形結構以及shouldComponentUpdate策略，對 component diff 進行演演算法優化
通過設定唯一 key 策略，對 element diff 進行演演算法優化

6.參考

React - 協調

Deep In React之淺談 React Fiber 架構(一)

react16的diff演演算法相比於react15有什麼改動？

React 原始碼剖析系列－不可思議的 react diff

傳統diff演演算法的演演算法複雜度為什麼是o(n3)?

深入理解React：diff 演演算法

深入理解React：diff 演演算法

深入理解React：diff 演算法

深入理解React：事件機制原理

git深入理解(三)：git diff詳解

深入淺析React中diff演算法

C#資料結構與算法系列（十五）：排序演演算法（SortAlgorithm）

深入理解golang：sync.map

深入理解 JUC：AQS 佇列同步器

深入理解golang：Context

深入理解golang：記憶體分配原理

git深入理解(四)：git log詳解

如何深入理解React的ref 屬性

深入理解Java：String

深入理解Java：註解（Annotation）自定義註解入門

《深入理解Kafka：核心設計與實踐原理》讀書筆記

深入理解React State 原理

JavaScript深入理解系列：call與apply

MAUI新生3.1-深入理解XAML：附加屬性AttachedProperty

MAUI新生3.4-深入理解XAML：資料模板DataTemplate

《深入理解Java虛擬機器器》（四）：垃圾收集演演算法以及記憶體分配策略

深入理解React：diff 演演算法

相關推薦