14 關於微控制器宕機的一些問題
博主在最近的一個專案中測試系統的高低溫實驗,結果意外的發現經過高低溫實驗後(80℃到-20攝氏度)微控制器有些已經宕機了,所以不得不著手研究一下這個問題,在網上查閱資料後,基本上可以歸結於以下幾個問題:
1. 意外中斷。是否打開了某個中斷,但是沒有響應和清除中端標誌,導致程式一直進入中斷,造成宕機假象
2. 中斷變數處理不妥。若定義某些會在中斷中修改的全域性變數,這時要注意兩個問題:首先為了防止編譯器優化中斷變數,要在這些變數定義時前加volatile,其次在主迴圈中讀取中斷變數前應該首先關閉全域性中斷,防止讀到一半被中斷給修改了,讀完之後再開啟全域性中斷;否則出現造成資料亂套。
3. 地址溢位,常見錯誤為指標操作錯誤。我要著重說的是陣列下標使用迴圈函式中迴圈變數,如果迴圈變數沒控制好則會出現陣列下標越界,意外修改系統的暫存器造成宕機,這種情況下如果宕機說明運氣好,否則後面不知道發生什麼頭疼的事。
4. 無條件的死迴圈;比如使用while(x);等待電平變化,正常情況下x都會變成0,就怕萬一,因此最好加上時間限制;
5. 看門狗沒有關閉。有的微控制器即使沒使用看門狗開機時也有可能意外自動開啟了最小週期的看門狗,導致軟體不斷復位,造成宕機,這個要看晶片手冊,最好在程式復位後首先應該顯式清除看門狗再關閉看門狗;
6. 堆疊溢位。最難查詢的問題,對於容量小的微控制器,儘量減少函式呼叫層級,減少區域性變數,從而減少壓棧的時候所需的空間。當你把以上幾條都試過不能解決問題,試一試把你的被呼叫少函式直接內建到呼叫的地方並且把佔用RAM大的區域性變數改成全域性變數,試一試說不定就可以了。
這個幾個問題可以從程式碼程式設計風格上解決的大部分都能夠解決,例如外部中斷或者全域性變數,還有一些事在中斷函式中的遞迴比較繁瑣。如果在注意程式設計風格的前提下不能解決當前的問題,那麼就要注意使用微控制器自帶的暫存器來監察異常狀況。
在atmega8這款微控制器中的MCUCSR暫存器來監察當前情況
MCU 控制和狀態暫存器-
MCUCSR
MCU 控制和狀態暫存器提供了有關引起MCU 復位的復位源的資訊。
• Bit 7..4 – Res: 保留
這幾位保留,讀操作始終為"0”。
• Bit 3 – WDRF: 看門狗復位標誌
看門狗復位發生時置位。上電覆位將使其清零,也可以通過寫”0” 來清除。
• Bit 2 – BORF: 掉電檢測復位標誌
掉電檢測復位發生時置位。上電覆位將使其清零,也可以通過寫”0” 來清除。
• Bit 1 – EXTRF: 外部復位標誌
外部復位發生時置位。上電覆位將使其清零,也可以通過寫”0” 來清除。
• Bit 0 – PORF: 上電覆位標誌
上電覆位發生時置位。只能通過寫”0” 來清除。
為了使用這些復位標誌來識別復位條件,使用者應該儘早讀取此暫存器的資料,然後將其復位。如果在其他復位發生之前將此暫存器復位,則後續復位源可以通過檢查復位標誌來了解。
在目前的專案工作中,經過排查我們發現了主要原因是,當主程式宕機時定時器卻還在不停的計數,於是導致看門狗不能復位,所以導致了程式跑死的結果。
程式碼中我們可以這樣進行改進:
主程式中我們可以宣告一個變數看門狗的復位標誌,然後在中斷中進行判斷:bit wdtflag=0;
在主程式中對其進行賦值:
void main(void)
{
while(1)
{
bit wdtflag=1;//每次進入while迴圈的時候將其置位
}
}
中斷程式中進行判斷
interrupt [TIM0_OVF] void timer0_ovf_isr(void)
{
if(wdtflag) //防止主程式宕機而中斷不宕機
{
wdtflag=0;
#asm("wdr")
}
}
這樣就可以和主程式中的看門狗進行一個聯絡,防止主程式已經跑飛但是在中斷函式中卻不能復位的問題。