1. 程式人生 > >MDK C++中對內聯的極度優化

MDK C++中對內聯的極度優化

強制 分支 count str bool disable 決定 mas pre

先來看看我們SmartIRQ的具體實現

// 智能IRQ,初始化時備份,銷毀時還原
class SmartIRQ
{
public:
    force_inline SmartIRQ(bool enable = false)
    {
        _state = __get_PRIMASK();
        if(enable)
            __enable_irq();
        else
            __disable_irq();
    }

    force_inline ~SmartIRQ()
    {
        __set_PRIMASK(_state);
    }
    
private: uint _state; };

在構造的時候備份,然後根據參數決定打開還是關閉中斷。
在系統內核時鐘裏面,關鍵操作需要關閉中斷,最後打開,以免其它中斷影響關鍵操作的原子事務性。

於是我們有:

ulong Time::CurrentTicks()
{
    SmartIRQ irq;

    uint value = (SysTick->LOAD - SysTick->VAL);
    if(SysTick->CTRL & SysTick_CTRL_COUNTFLAG)
    {
        Ticks += SysTick->LOAD;
    }

    
return Ticks + value; }

其中irq在離開作用域時被釋放,自動調用SmartIRQ的析構函數,還原了中斷狀態

因為調用極其頻繁,最高可能1us調用一次該函數,於是我們給SmartIRQ的構造和析構都加了force_inline強制使用內聯。
總所周知,C++的內聯其實就是以空間換時間,把一個函數的代碼全部搬出來直接使用,省去了調用、壓棧、彈棧、返回等操作。
SmartIRQ的析構函數就罷了,但是構造函數代碼量還是有好幾行的。
懷著試一試的心態調試該函數,直接觀察匯編代碼:

0x08000804 B570      PUSH     {r4-r6,lr}
0x08000806 F3EF8210  MRS      r2,PRIMASK
0x0800080A B672      CPSID    I
0x0800080C 4D0B      LDR      r5,[pc,#
44] ; @0x0800083C 0x0800080E 6969 LDR r1,[r5,#0x14] 0x08000810 69AB LDR r3,[r5,#0x18] 0x08000812 1ACC SUBS r4,r1,r3 0x08000814 6929 LDR r1,[r5,#0x10] 0x08000816 2300 MOVS r3,#0x00 0x08000818 03C9 LSLS r1,r1,#15 0x0800081A 2900 CMP r1,#0x00 0x0800081C DA06 BGE 0x0800082C 0x0800081E 6886 LDR r6,[r0,#0x08] 0x08000820 68C1 LDR r1,[r0,#0x0C] 0x08000822 696D LDR r5,[r5,#0x14] 0x08000824 1975 ADDS r5,r6,r5 0x08000826 4159 ADCS r1,r1,r3 0x08000828 6085 STR r5,[r0,#0x08] 0x0800082A 60C1 STR r1,[r0,#0x0C] 0x0800082C 6885 LDR r5,[r0,#0x08] 0x0800082E 68C1 LDR r1,[r0,#0x0C] 0x08000830 1928 ADDS r0,r5,r4 0x08000832 4159 ADCS r1,r1,r3 0x08000834 F3828810 MSR PRIMASK,r2 0x08000838 BD70 POP {r4-r6,pc}

MDK C++編譯器優化到了極度變態的地步!
不僅僅內聯了,SmartIRQ裏面有兩個分支語句,直接被他省略了其中一個,因為參數true已經確定。
更加變態的是,本來采用SmartIRQ內部私有成員_state保存狀態,析構時恢復的,它直接把這個狀態保存到寄存器r2裏面去,連_state的內存都給省了。

MDK C++中對內聯的極度優化