高效能Web動畫和渲染原理系列(2)——渲染管線和CPU渲染
目錄
- 一. 高效能動畫
- 二. 畫素渲染管線
- 基本渲染流程
- 迴流和重繪
- 三. 舊軟體渲染
- 渲染物件(RenderObject)
- 渲染層(RenderLayer)
- 四. 從canvas體會分層優勢
- 不分層的情況
- 分層繪製
- 層的合併
- 五.小結
示例程式碼託管在:http://www.github.com/dashnowords/blogs
部落格園地址:《大史住在大前端》原創博文目錄
華為雲社群地址:【你要的前端打怪升級指南】
一. 高效能動畫
動畫的流暢程度通常是以FPS
(Frame Per Second,每秒幀率)作為衡量的。在攝像機錄製視訊時每一幀實際上包含了一段時間內的畫面記錄(長曝光攝影的道理相同的),如果畫面裡的事物在運動,那麼暫停播放時看到的畫面通常都是模糊的,這樣的畫面也被稱為“模糊幀”,加上雙眼“視覺暫留”效果的影響,影視作品一般只要達到24FPS
就可以展示出看起來連續運動的畫面;而在頁面的渲染中,每一幀都是由計算機計算渲染出來的精確畫面,幀和幀之間並不存在模糊過渡,所以通常認為需要達到50FPS~60FPS
為了達到儘可能接近60FPS
以上的幀率,瀏覽器每一幀的計算和繪製所花費的時間就需要控制在1000/60≈16.6ms以內,根據Google開發者社群提供的資料,開發者最好能夠將所有的工作控制在10ms
左右,以便給瀏覽器一些處理內部工作的時間,否則就無法在限定的時間內完成畫面更新,動態的內容就會表現出卡頓,對使用者體驗造成負面影響。下一節就來看一下,在這16ms
的時間裡,瀏覽器都需要完成哪些任務。
二. 畫素渲染管線
基本渲染流程
談起瀏覽器的工作流程,你可能會在大多數文章中見過下面這張圖:
它直觀地描述了瀏覽器如何將HTML
檔案和CSS
樣式檔案通過逐步處理最終合成渲染樹並展示在頁面上的過程,當然其中每一步都是非常複雜的,如果你對此還不熟悉,可以通過【瀏覽器的工作原理:新式網路瀏覽器幕後揭祕】這篇文章進行了解(極力推薦這篇文章!)。但實際上上面的流程裡並沒有覆蓋網站的整個生命週期,它只是描述了從使用者獲取到網站首頁和資原始檔後到完成首屏渲染這段時間內所做的工作,儘管工作流程幾乎是一致的,但諸如響應使用者的互動動作,在頁面上實現動畫等等內容,只通過上面的巨集觀原理圖理解起來還是很困難的。當開發者談及瀏覽器渲染效能的話題時,我們通常會聽到“重排”、“重繪”等術語,實際上它們就是對這後半部分工作的描述,它被稱為“瀏覽器畫素渲染管線”,此時就需要祭出Google開發者社群提供的基本原理圖:
編寫在JavaScript
程式碼中的那些事件監聽器、定時任務等等非同步觸發的程式碼就會在橙色的部分執行,這部分程式碼執行在主執行緒中,如果有問題的程式碼或是執行時間較長的程式碼在其中造成了阻塞,後續的幾個步驟就只能等著,這會直接延緩頁面的渲染甚至導致頁面直接崩潰,當JavaScript
執行完一個巨集任務並清空了當前的微任務佇列後,就會開始UI渲染流程,進入下一個環節。
在Style
階段需要找出發生變更的樣式並重新計算相關的尺寸,當然在首屏渲染之前第一次處理CSS
樣式時,瀏覽器肯定已經對計算結果進行了快取,以便在這畫素渲染管線處理時節省時間。
計算完樣式本身後,就需要進入Layout
階段,重新來計算髮生樣式變動的元素應該以怎樣的盒模型尺寸繪製在畫面上的哪個位置,網頁中的基本排版遵循正常文件流的規則,所以一個元素尺寸變化後,就有可能需要重新計算其父子元素或臨近元素的位置,不難想象這是一個極容易引發蝴蝶效應的環節。完成了Layout
佈局後,可以看到圖中使用的顏色也發生了變化,因為相對而言它們的開銷就比較輕量了。
Paint
階段就是生成畫素資料的過程,它會將元素的背景、邊框、陰影等等可見的部分繪製出來,它們可能會被繪製在多個層上。
Composite
階段,由於繪製階段生成的畫面可能分佈於多個層,那麼最終渲染的結果就需要將它們按照一定的順序完成畫面的重疊,這就是瀏覽在合成階段主要的工作,當然這個過程並不一定是由CPU
獨自完成的,後面還會講到。當動畫執行時,瀏覽器會不斷建立幀,上面的過程就會反覆發生,從而實現幀畫面的不斷變動:
迴流和重繪
不同的CSS
樣式的效能開銷和造成的影響是不同的,所以上面的畫素渲染管路的各個階段並不一定都有工作要做,如果發生變更的元素樣式不會造成佈局變化,那麼layout
階段就不需要做什麼工作,如果發生變更的CSS
屬性也可以不用重新計算各部分的畫素顏色,那麼paint
階段也就沒有什麼工作要做,這樣渲染管路就被簡化成為:
這是我們最期望得到的理想狀態。如果發生變化的CSS
屬性導致Layout
階段任務量的增加,這類情況就被稱為“迴流”或“重排”,如果發生變化的CSS
屬性導致了Paint
階段任務量的增加,這類情況就被稱為“重繪”,它的開銷相比Layout
而言更小,從管線的特徵不難明白,“迴流”必然會導致“重繪”,但反之則不一定成立。
只通過Composite
階段的工作就可以處理的CSS
屬性就是opacity
(透明度)和transform
(變形),它們是各類場景中優先推薦使用的效能最高的特性,transform
可以很方便地模擬出位置變化,在可以忽略畫面精度的情況下(例如純色的背景)也可以使用scale
來模擬尺寸變化。
所以在滿足需求的前提下,我們當然希望選擇改變效能開銷更小的屬性,以便可以在16ms
的時間內完成整個渲染管線的任務,這裡所說的效能,通常是指持續修改樣式時的效能開銷,暫不討論低頻的頁面狀態變動。關於CSS
屬相詳細的效能開銷,可以在【CSS Triggers】檢視詳情,每個瀏覽器的實現上有細微的差別。
opacity
和transform
的動畫效能開銷最小,並不是因為處理它們造成的影響時工作量減小了,而是因為這兩個屬性造成的影響可以在圖層合成時可以委託給強大的GPU
來執行。GPU
的基本架構和CPU
不同,它擁有更多算術邏輯單元(也就是ALU
),這使得它非常適合以平行計算的形式執行計算密集型任務,例如圖形的矩陣變換、人工神經網路的訓練等等。
而opacity
和transform
造成的影響,都可以通過改變圖層合成時的引數來進行處理,換句話說就是它可以直接使用之前生成的點陣圖畫素資料的快取,而不需要再重新計算,也不用更新畫素資料快取,配合上GPU
強大的算力,效能自然很能打。
三. 舊軟體渲染
現代瀏覽器多采用軟硬體混合渲染的方式來處理,軟體渲染的方式通常也被成為“舊軟體渲染”(與之相對應的是硬體加速渲染),“舊”只是出現時間比較早,並不表示它已經被硬體渲染所取代。最初的網頁並不是作為完整的應用存在的,而只是用來做一些資訊展示,二維渲染的場景居多(因為頁面上大多都是基於“盒模型”的矩形區域和文字包圍盒的計算和繪製),這時使用CPU
渲染的效能並不低,“舊軟體渲染”通常使用底層的二維圖形繪製庫,你可以藉助HTML Canvas 2D API
來類比理解,在canvas
畫板上實現的二維動畫,即使在逐幀動畫中進行覆蓋式的全畫布重繪,也能夠保持較高的幀率;對3D圖形學
有一定了解的小夥伴都知道,3D
渲染引擎只支援點、線和三角形的繪製,所以一個矩形就至少需要2個三角形來表示(當然也可是多個),直觀感覺上就是一種“殺雞用牛刀”的體驗,GPU
的算力雖然很牛逼,但通常記憶體空間非常有限,所以最好只在必要時有節制地使用GPU
。
本節我們先忘掉GPU
的加速能力,來看看軟體中需要如何處理頁面渲染。下面以WebKit
核心為例來說明一下渲染的基本處理過程以及建立合成層的條件。想要進一步瞭解的小夥伴可以嘗試閱讀朱永勝的《WebKit技術內幕》一書(不要輕易嘗試,很容易覺得自己不適合搞前端,甚至懷疑人生)。
渲染物件(RenderObject)
在DOM
樹解析時,瀏覽器會為可見元素建立一個RenderObject
類的例項,用於記錄繪製這個節點需要的一些資訊和方法,RenderObject
會依據HTML中的DOM結構生成一棵RenderObjectTree
,但瀏覽器並沒有直接使用它來生成一張點陣圖畫面,因為如果這樣做的話,頁面上發生任何變化時,都需要重新計算變更的區域並更新快取,它的確很節省空間,畢竟只需要快取一張靜態圖片中各個畫素點的顏色資料就可以了,但節省空間的代價就是無法節省時間,這樣的策略會加重重複運算的負擔。
渲染層(RenderLayer)
為了方便處理,WebKit
會根據RenderObjectTree
來對RenderObject
進行按層分類,並最終建立一棵包含多個渲染圖層資訊的RenderLayerTree
(渲染層樹),兩棵樹中的節點並不是一一對應的,當遍歷RenderObjectTree
時,只有符合一定條件的節點(比如獲取了上下文的canvas節點、video節點、具有透明樣式的節點等等,詳細的規則會根據平臺實現不同可能會有變化)會創建出新的RenderLayer
節點,而其他的節點只需要新增到祖先節點上已經存在的RenderLayer
節點上就可以了。規則如下:
除了根節點以外,一個
RenderLayer
節點的父親,就是它對應的RenderObject
節點的祖先鏈中最近的祖先,且兩者所在的RenderLayer
不是同一個。
根據《Webkit技術內幕》一書中的介紹,在軟體渲染中,每一個RenderLayer
物件都會有一個後端類,用來儲存該層繪製的結果(但是在硬體渲染中由於合成層的存在,所以並不會為每一個RenderLayer
生成後端類),你可以把後端類簡單地理解為結果快取,CPU
會將各個RenderLayer
的結果最終渲染為到一張位圖裡,然後交給GPU
展示,合成的過程也可以在GPU
中進行,也就是硬體加速渲染,這裡不再展開,但是僅考慮軟體渲染環節的話,RenderLayer樹就已經可以實現目的了。用過photoshop
的使用者可能會對分層這種處理形式比較熟悉,它的關鍵點就是在處理有重疊的區域時必須考慮先後順序。
直接看概念可能比較繞,做個簡單的比喻,比如碼農小強的爺爺有自己的房子,然後生了幾個孩子,這些孩子裡有的發展的比較好就自己買房單獨住處去了,發展的不太好的只能住在爺爺家裡,接著每個孩子又生了一堆孩子,也就是小強這一輩,當然也是發展的有好有差,以碼農小強為例,發展的好的就可以自己買房子住,發展的不好的就得拼爹了,如果他爹有房子,就可以住在爹家,如果很悲劇他爹也沒房子,那他就得和他爹一起住到他爹的爹家裡去(說住到墳墓裡的你放學別走),RenderObject
到RenderLayer
的生成過程也是類似的。
四. 從canvas體會分層優勢
Webkit
底層的2D
渲染使用Skia
庫,它是類似於Canvas API
的二維圖形繪製庫,為了方便理解軟體渲染的優勢,下面通過Canvas API
來看看分層到底帶來了哪些變化,本例中我們先不考慮重新計算佈局的情況,僅考慮重繪的工作。以下圖為例(如果不瞭解canvas
動畫繪製,可以參考筆者曾經寫的一篇相關博文【響應式程式設計的思維藝術 (2)響應式Vs面向物件】):
假設在下面的分析中,地面
、天空
、山
、雲
和人
是分別繪製上去的,人物和雲是可以水平運動的,人比山距離觀察者更近。
不分層的情況
在canvas
中,使用context.getImageData(x, y, width, height)
方法取得畫布上對應矩形區域的畫素資料,在不分層的情況下,假設第一次渲染後,使用這個方法將畫布中的畫素資料取出來儲存在backUp
變數上(畫素資料是一個很長的一維陣列,按順序逐行儲存著畫面中每個畫素點的rgba
4個值),也就是隻為最終結果建立了一份快取,此時實際上已經丟失了一部分資訊了,例如雲和天空、人和天空都有重疊的部分,而重疊部分的畫素只保留了最上面一層的值。
當需要繪製逐幀動畫時,問題就來了。人物是運動的,那麼程式自然知道下一幀應該將人物繪製在什麼地方,但是如果直接繪製,原來的人物仍然會留在圖中,這樣逐幀畫下去,畫面上就會留下一排人物運動的分解畫面,這顯然是不行的;如果把人物先擦掉呢?也是不行的,這樣雖然可以保持畫面上只有一個跑動的人物,但是因為畫面被快取時,畫素已經被覆蓋掉了,如果把人物擦掉,只從快取的資料中,是無法知道被擦掉的這部分畫素點應該被修復成什麼樣子的,例如下圖中,快取中是上一幀的資料復原後的圖,但是如果下一幀人物離開了原位置,原來的畫面就無法利用快取直接恢復了,例如上圖中紅框中的部分就留下了人物的殘影。
假設在上面的畫面中,人物的大小是100*100
,快取的畫素中,其位置是(200,400)
,假設一幀中它平移了10
個畫素,那麼就可以粗略地認為需要更新的區域是左上角為(200,400)
,寬110
,高100
的矩形區域。儘管這個110*100
的矩形區域可能只佔了整個快取區域的10%
,也就是大部分快取的畫素點還是有效的,但為了修復這部分畫面,程式將不得不重新計算每個物件的繪製結果,然後將這個區域的畫面按照層次重新繪製上去,在上面的示例中,變更區擦除後從下到上依次要繪製天空、山和人物,人物是繪製在最上層的以便可以完整顯示,人物離開後的空白畫素也在重繪中被修復。
分層繪製
單幅點陣圖畫素快取的劣勢其實已經很明顯了,下面再來看看分層的情況,假如上述畫面中的物件分別繪製在不同的canvas
畫布上,那麼一共就需要5個canvas
元素,由於畫布是透明底色的,所以最終顯示結果是疊加而成的。接著為每個canvas
層都生成畫素資料的快取,那麼在面對同樣的更新場景時,天空、地面、山和雲都可以不用操作,而只需要更新人物所在的canvas
層,先將受影響的區域擦除,接著重新計算人物的繪製結果並更新單層的快取,最後將新的結果繪製到目標位置上,相比之下,分層快取的方案使用了更多的儲存空間來快取繪製的畫素資料,但減少了更新時的計算量,是典型的空間換時間的做法。
層的合併
顯示器上最終呈現的是一幅點陣圖畫面,所以即使在上面的示例中使用了5個分佈在不同層次的canvas
標籤,實際上計算機在處理時仍然會對各層的畫素資料按層進行合併計算。上面的示例中存在一個很容易發現的優化點,就是無論怎麼重繪,實際上山
和地面
的繪製結果都會擋住對應區域的天空
的繪製結果,而且它們都是靜態的,所以天空
的快取資料中,與山
和地面
重疊的部分實際上沒什麼用,如果更新的區域發生在重疊區,那麼更新畫面的時候,天空
層總是要先繪製一次然後再被更高層的山
或者地面
覆蓋掉,這時候就可以利用層合併的思想進行優化,也就是直接將天空,山和地面繪製在同個canvas
上,它們整體的繪製結果快取時只需要佔用原來1/3的空間(3張點陣圖變1張了),但對於後續的重繪卻不會造成影響,這樣就可以省掉很大一部分確定沒有用的快取。當然上面的示例只是比較簡單的情況,在DOM節點渲染結果的處理時有更加複雜的層劃分和層合併的規則,但是優化的思想基本是一樣的。
五.小結
從直接繪製到分層繪製再到層的合併的過程,實際上就是從DOM節點到RenderObject樹
再到RenderLayer樹
的變換過程,利用canvas
的例項就比較容易理解軟體渲染過程中的一些策略了,很多東西你覺得不理解,並不一定是因為它本身有多複雜,只是因為你無法知道它是為了解決什麼問題而存在的,實際上當你面對同樣的問題時,可能也會採取類似甚至更好的處理策略,但當我們只看別人描述解決方案時,通常都會感覺到一個東西“特別複雜”或者“特別高大上”,所以請永遠保持謙遜,但也別丟了你的自信。最後分享一個最近很喜歡的冷段子,下一期再見。
問:"從前有一隻菜鳥,他特別菜,但是他仍然在飛,請問為什麼?"
答:“因為他有一顆勇敢的心!”