MDK C++中對內聯的極度優化
阿新 • • 發佈:2017-09-01
強制 分支 count str bool disable 決定 mas pre
先來看看我們SmartIRQ的具體實現
// 智能IRQ,初始化時備份,銷毀時還原 class SmartIRQ { public: force_inline SmartIRQ(bool enable = false) { _state = __get_PRIMASK(); if(enable) __enable_irq(); else __disable_irq(); } force_inline ~SmartIRQ() { __set_PRIMASK(_state); }private: uint _state; };
在構造的時候備份,然後根據參數決定打開還是關閉中斷。
在系統內核時鐘裏面,關鍵操作需要關閉中斷,最後打開,以免其它中斷影響關鍵操作的原子事務性。
於是我們有:
ulong Time::CurrentTicks() { SmartIRQ irq; uint value = (SysTick->LOAD - SysTick->VAL); if(SysTick->CTRL & SysTick_CTRL_COUNTFLAG) { Ticks += SysTick->LOAD; }return Ticks + value; }
其中irq在離開作用域時被釋放,自動調用SmartIRQ的析構函數,還原了中斷狀態
因為調用極其頻繁,最高可能1us調用一次該函數,於是我們給SmartIRQ的構造和析構都加了force_inline強制使用內聯。
總所周知,C++的內聯其實就是以空間換時間,把一個函數的代碼全部搬出來直接使用,省去了調用、壓棧、彈棧、返回等操作。
SmartIRQ的析構函數就罷了,但是構造函數代碼量還是有好幾行的。
懷著試一試的心態調試該函數,直接觀察匯編代碼:
0x08000804 B570 PUSH {r4-r6,lr} 0x08000806 F3EF8210 MRS r2,PRIMASK 0x0800080A B672 CPSID I 0x0800080C 4D0B LDR r5,[pc,#44] ; @0x0800083C 0x0800080E 6969 LDR r1,[r5,#0x14] 0x08000810 69AB LDR r3,[r5,#0x18] 0x08000812 1ACC SUBS r4,r1,r3 0x08000814 6929 LDR r1,[r5,#0x10] 0x08000816 2300 MOVS r3,#0x00 0x08000818 03C9 LSLS r1,r1,#15 0x0800081A 2900 CMP r1,#0x00 0x0800081C DA06 BGE 0x0800082C 0x0800081E 6886 LDR r6,[r0,#0x08] 0x08000820 68C1 LDR r1,[r0,#0x0C] 0x08000822 696D LDR r5,[r5,#0x14] 0x08000824 1975 ADDS r5,r6,r5 0x08000826 4159 ADCS r1,r1,r3 0x08000828 6085 STR r5,[r0,#0x08] 0x0800082A 60C1 STR r1,[r0,#0x0C] 0x0800082C 6885 LDR r5,[r0,#0x08] 0x0800082E 68C1 LDR r1,[r0,#0x0C] 0x08000830 1928 ADDS r0,r5,r4 0x08000832 4159 ADCS r1,r1,r3 0x08000834 F3828810 MSR PRIMASK,r2 0x08000838 BD70 POP {r4-r6,pc}
MDK C++編譯器優化到了極度變態的地步!
不僅僅內聯了,SmartIRQ裏面有兩個分支語句,直接被他省略了其中一個,因為參數true已經確定。
更加變態的是,本來采用SmartIRQ內部私有成員_state保存狀態,析構時恢復的,它直接把這個狀態保存到寄存器r2裏面去,連_state的內存都給省了。
MDK C++中對內聯的極度優化