1. 程式人生 > >實時調度類

實時調度類

有趣的 _array png cpu class 循環 是否 排隊 1.2

按照POSIX標準的強制要求,除了“普通”進程之外, Linux還支持兩種實時調度類。調度器結構使得實時進程可以平滑地集成到內核中,而無需修改核心調度器,這顯然是調度類帶來的好處。

現在比較適合於回想一些很久以前討論過的事實。實時進程的特點在於其優先級比普通進程高,對應地,其static_prio值總是比普通進程低,如圖2-14所示。 rt_task宏通過檢查其優先級來證實給定進程是否是實時進程,而task_has_rt_policy則檢測進程是否關聯到實時調度策略。

1. 性質

實時進程與普通進程有一個根本的不同之處:如果系統中有一個實時進程且可運行,那麽調度器總是會選中它運行,除非有另一個優先級更高的實時進程。

現有的兩種實時類,不同之處如下所示。

  • 循環進程(SCHED_RR)有時間片,其值在進程運行時會減少,就像是普通進程。在所有的時間段都到期後,則該值重置為初始值,而進程則置於隊列的末尾。這確保了在有幾個優先級相同的SCHED_RR進程的情況下,它們總是依次執行。
  • 先進先出進程(SCHED_FIFO)沒有時間片,在被調度器選擇執行後,可以運行任意長時間。

很明顯,如果實時進程編寫得比較差,系統可能變得無法使用。只要寫一個無限循環,循環體內不進入睡眠即可。在編寫實時應用程序時,應該多加小心。

1.2 數據結構

實時進程的調度類定義如下:

kernel/sched-rt.c

const struct sched_class rt_sched_class = {
.next = &fair_sched_class,
.enqueue_task = enqueue_task_rt,
.dequeue_task = dequeue_task_rt,
.yield_task = yield_task_rt,
.check_preempt_curr = check_preempt_curr_rt,
.pick_next_task = pick_next_task_rt,
.put_prev_task = put_prev_task_rt,
.set_curr_task = set_curr_task_rt,
.task_tick = task_tick_rt,
};

實時調度器類的實現比完全公平調度器簡單。大約只需要250行代碼,而CFS則需要1100行!

kernel/sched.c

struct rq {
...
t_rq rt;
...
}

就緒隊列非常簡單,鏈表就足夠了:

kernel/sched.c

struct rt_prio_array {
DECLARE_BITMAP(bitmap, MAX_RT_PRIO+1); /* 包含1比特用於間隔符 */
struct list_head queue[MAX_RT_PRIO];
};
struct rt_rq {
struct rt_prio_array active;
};

具有相同優先級的所有實時進程都保存在一個鏈表中,表頭為active.queue[prio],而active.bitmap位圖中的每個比特位對應於一個鏈表,凡包含了進程的鏈表,對應的比特位則置位。如果鏈表中沒有進程,則對應的比特位不置位。圖2-23說明了具體情形。

技術分享圖片

實時調度器類中對應於update_cur的是update_curr_rt,該函數將當前進程在CPU上執行花費的時間記錄在sum_exec_runtime中。所有計算的單位都是實際時間,不需要虛擬時間。這樣就簡化了很多。

3. 調度器操作

進程的入隊和離隊都比較簡單。只需以p->prio為索引訪問queue數組queue[p->prio],即可獲得正確的鏈表,將進程加入鏈表或從鏈表刪除即可。如果隊列中至少有一個進程,則將位圖中對應的比特位置位;如果隊列中沒有進程,則清除位圖中對應的比特位。請註意,新進程總是排列在每個鏈表的末尾。

兩個比較有趣的操作分別是,如何選擇下一個將要執行的進程,以及如何處理搶占。首先考慮pick_next_task_rt,該函數放置選擇下一個將執行的進程。其代碼流程圖在圖2-24給出。

技術分享圖片

sched_find_first_bit是一個標準函數,可以找到active.bitmap中第一個置位的比特位,這意味著高的實時優先級(對應於較低的內核優先級值),因此在較低的實時優先級之前處理。取出所選鏈表的第一個進程,並將se.exec_start設置為就緒隊列的當前實際時鐘值,即可。

周期調度的實現同樣簡單。SCHED_FIFO進程最容易處理。它們可以運行任意長的時間,而且必須使用yield系統調用將控制權顯式傳遞給另一個進程:

kernel/sched.c

static void task_tick_rt(struct rq *rq, struct task_struct *p)
{
update_curr_rt(rq);
/*
* 循環進程需要一種特殊形式的時間片管理。
* 先進先出進程沒有時間片。
*/
if (p->policy != SCHED_RR)
return;
...

如果當前進程是循環進程,則減少其時間片。在尚未超出時間段時,沒什麽可作的,進程可以繼續執行。計數器歸0後,其值重置為DEF_TIMESLICE,即100 * HZ / 1000,亦即100毫秒。如果該進程不是鏈表中唯一的進程,則重新排隊到末尾。通過用set_tsk_need_resched設置TIF_NEED_RESCHED標誌,照常請求重調度:

為將進程轉換為實時進程,必須使用sched_setscheduler系統調用。這裏不詳細討論該函數了,因為它只執行了下列簡單任務。

  • 使用deactivate_task將進程從當前隊列移除。
  • 在task_struct中設置實時優先級和調度類。
  • 重新激活進程

如果進程此前不在任何就緒隊列上,那麽只需要設置調度類和新的優先級數值。停止進程活動和重激活則是不必要的。

要註意,只有具有root權限(或等價於CAP_SYS_NICE)的進程執行了sched_setscheduler系統調用,才能修改調度器類或優先級。否則,下列規則適用。

  • 調度類只能從SCHED_NORMAL改為SCHED_BATCH,或反過來。改為SCHED_FIFO是不可能的。
  • 只有目標進程的UID或EUID與調用者進程的EUID相同時,才能修改目標進程的優先級。此外,優先級只能降低,不能提升。

實時調度類