理解UIView的繪制-孫亞洲
前言
最近研究OpenGL ES相關和 GPU 相關 發現這篇文章很具有參考的入門價值.
理解 UIView 的繪制, UIView 是如何顯示到 Screen 上的?
首先要從Runloop
開始說,iOS 的MainRunloop
是一個60fps 的回調,也就是說16.7ms(毫秒)會繪制一次屏幕,這個時間段內要完成:
view
的緩沖區創建view
內容的繪制(如果重寫了 drawRect)
這些 CPU
的工作.
然後將這個緩沖區交給GPU
渲染, 這個過程又包含:
- 多個
view
的拼接(compositing) - 紋理的渲染(Texture)等.
最終現實在屏幕上.因此,如果在16.7ms 內完不成這些操作, eg: CPU做了太多的工作, 或者view
GPU
壓力太大,就會導致”卡”的現象,也就是 丟幀,掉幀.
蘋果官方給出的最佳幀率是:60fps(60Hz),也就是一幀不丟, 當然這是理想中的絕佳體驗.
這個60fps
該怎麽理解呢?
一般來說如果幀率達到 25+fps
(fps >= 25幀以上,不是25加別看錯),人眼就基本感覺不到卡頓了,因此,如果你能讓你的 iOS 程序穩定保持在30fps
已經很不錯了, 註釋,是”穩定”在30fps,而不是, 10fps
,40fps
,20fps
這樣的跳動,如果幀頻不穩就會有卡的感覺,60fps
真的很難達到, 尤其是在 iPhone 4/4s等 32bit 位機上,不過現在蘋果已經全面放棄32位,支持最低64位會好很多.
總的來說, UIView從繪制到Render的過程有如下幾步:
- 每一個
UIView
都有一個layer
- 每一個
layer
都有個content
,這個content
指向的是一塊緩存,叫做backing store
.
UIView
的繪制和渲染是兩個過程:
- 當
UIView
被繪制時,CPU執行drawRect
,通過context
將數據寫入backing store
- 當
backing store
寫完後,通過render server交給GPU去渲染,將backing store中的bitmap數據顯示在屏幕上.
上面提到的從CPU
到GPU
的過程可用下圖表示:
下面具體來討論下這個過程
- CPU bound:
假設我們創建一個 UILabel
UILabel* label = [[UILabel alloc]initWithFrame:CGRectMake(10, 50, 300, 14)]; label.backgroundColor = [UIColor whiteColor]; label.font = [UIFont systemFontOfSize:14.0f]; label.text = @"test"; [self.view addSubview:label]; |
這個時候不會發生任何操作, 由於 UILabel 重寫了drawRect
方法,因此,這個 View
會被 marked as "dirty"
:
類似這個樣子:
然後一個新的Runloop
到來,上面說道在這個Runloop
中需要將界面渲染上去,對於UIKit
的渲染,Apple用的是它的Core Animation
。
做法是在Runloop開始的時候調用:
[CATransaction begin] |
在Runloop
結束的時候調用
[CATransaction commit] |
在begin
和commit
之間做的事情是將view
增加到view hierarchy
中,這個時候也不會發生任何繪制的操作。
當[CATransaction commit]
執行完後,CPU
開始繪制這個view
:
首先CPU
會為layer
分配一塊內存用來繪制bitmap
,叫做backing store
創建指向這塊bitmap
緩沖區的指針,叫做CGContextRef
通過Core Graphic
的api
,也叫Quartz2D
,繪制bitmap
將layer
的content
指向生成的bitmap
清空dirty flag
標記
這樣CPU
的繪制基本上就完成了.
通過time profiler
可以完整的看到個過程:
Running Time Self Symbol Name 2.0ms 1.2% 0.0 +[CATransaction flush] 2.0ms 1.2% 0.0 CA::Transaction::commit() 2.0ms 1.2% 0.0 CA::Context::commit_transaction(CA::Transaction*) 1.0ms 0.6% 0.0 CA::Layer::layout_and_display_if_needed(CA::Transaction*) 1.0ms 0.6% 0.0 CA::Layer::display_if_needed(CA::Transaction*) 1.0ms 0.6% 0.0 -[CALayer display] 1.0ms 0.6% 0.0 CA::Layer::display() 1.0ms 0.6% 0.0 -[CALayer _display] 1.0ms 0.6% 0.0 CA::Layer::display_() 1.0ms 0.6% 0.0 CABackingStoreUpdate_ 1.0ms 0.6% 0.0 backing_callback(CGContext*, void*) 1.0ms 0.6% 0.0 -[CALayer drawInContext:] 1.0ms 0.6% 0.0 -[UIView(CALayerDelegate) drawLayer:inContext:] 1.0ms 0.6% 0.0 -[UILabel drawRect:] 1.0ms 0.6% 0.0 -[UILabel drawTextInRect:] |
假如某個時刻修改了label
的text
:
label.text = @"hello world"; |
由於內容變了,layer
的content
的bitmap
的尺寸也要變化,因此這個時候當新的Runloop
到來時,CPU
要為layer
重新創建一個backing store
,重新繪制bitmap
.CPU
這一塊最耗時的地方往往在Core Graphic
的繪制上,關於Core Graphic
的性能優化是另一個話題了,又會牽扯到很多東西,就不在這裏討論了.
GPU bound:
CPU
完成了它的任務:將view
變成了bitmap
,然後就是GPU
的工作了,GPU
處理的單位是Texture
.
基本上我們控制GPU
都是通過OpenGL
來完成的,但是從bitmap
到Texture
之間需要一座橋梁,Core Animation
正好充當了這個角色:Core Animation
對OpenGL
的api
有一層封裝,當我們要渲染的layer
已經有了bitmap content
的時候,這個content
一般來說是一個CGImageRef
,CoreAnimation
會創建一個OpenGL
的Texture
並將CGImageRef(bitmap)
和這個Texture
綁定,通過TextureID
來標識。
這個對應關系建立起來之後,剩下的任務就是GPU
如何將Texture
渲染到屏幕上了。GPU
大致的工作模式如下:
整個過程也就是一件事:
CPU
將準備好的bitmap
放到RAM
裏,GPU
去搬這快內存到VRAM
中處理。
而這個過程GPU
所能承受的極限大概在16.7ms完成一幀的處理,所以最開始提到的60fps其實就是GPU能處理的最高頻率.
因此,GPU
的挑戰有兩個:
- 將數據從
RAM
搬到VRAM
中 - 將
Texture
渲染到屏幕上
這兩個中瓶頸基本在第二點上。渲染Texture
基本要處理這麽幾個問題:
- Compositing:
Compositing
是指將多個紋理拼到一起的過程,對應UIKit
,是指處理多個view
合到一起的情況,如:
[self.view addsubview : subview]。 |
如果view
之間沒有疊加,那麽GPU
只需要做普通渲染即可.
如果多個view
之間有疊加部分,GPU
需要做blending
.
加入兩個view
大小相同,一個疊加在另一個上面,那麽計算公式如下:
R
= S
+D
*(1
-Sa
)
R
: 為最終的像素值S
: 代表 上面的Texture(Top Texture)D
: 代表下面的Texture(lower Texture)
其中S
,D
都已經pre-multiplied
各自的alpha
值。Sa
代表Texture
的alpha
值。
假如Top Texture
(上層view
)的alpha
值為1
,即不透明。那麽它會遮住下層的Texture
.
即,R
= S
。是合理的。
假如Top Texture
(上層view
)的alpha
值為0.5
,S
為(1,0,0)
,乘以alpha
後為(0.5,0,0)
。D
為(0,0,1)
。
得到的R
為(0.5,0,0.5)
。
基本上每個像素點都需要這麽計算一次。
因此,view
的層級很復雜,或者view
都是半透明的(alpha
值不為1
)都會帶來GPU
額外的計算工作。
- Size
這個問題,主要是處理image
帶來的,假如內存裏有一張400x400
的圖片,要放到100x100
的imageview
裏,如果不做任何處理,直接丟進去,問題就大了,這意味著,GPU
需要對大圖進行縮放到小的區域顯示,需要做像素點的sampling
,這種smapling
的代價很高,又需要兼顧pixel alignment
。 計算量會飆升。
- Offscreen Rendering And Mask
如果我們對layer
做這樣的操作:
label.layer.cornerRadius = 5.0f; label.layer.masksToBounds = YES; |
會產生offscreen rendering
,它帶來的最大的問題是,當渲染這樣的layer
的時候,需要額外開辟內存,繪制好radius,mask
,然後再將繪制好的bitmap
重新賦值給layer
。
因此繼續性能的考慮,Quartz
提供了優化的api
:
label.layer.cornerRadius = 5.0f; label.layer.masksToBounds = YES; label.layer.shouldRasterize = YES; label.layer.rasterizationScale = label.layer.contentsScale; |
簡單的說,這是一種cache
機制。
同樣GPU
的性能也可以通過instrument
去衡量:
紅色代表GPU
需要做額外的工作來渲染View
,綠色代表GPU
無需做額外的工作來處理bitmap
。
全文完
https://www.sunyazhou.com/2017/10/16/20171016UIView-Rendering/
理解UIView的繪制-孫亞洲