1. 程式人生 > >linux核心V2.6.11學習筆記(2)--list和hlist

linux核心V2.6.11學習筆記(2)--list和hlist

這兩個資料結構在核心中隨處可見,不得不拿出來單獨講講.

這兩個資料結構都是為了方便核心開發者在使用到類似資料結構的時候不必自行開發(雖然不難),因此它們需要做到足夠的"通用性",也就是說,今天可以用它們做一個存放程序的連結串列,明天同樣可以做一個封裝定時器的連結串列.兩個資料結構的對外API封裝了針對它們的基本操作,也是最常見的操作,比如遍歷,查詢等等.

一般的,如果我們需要寫一個連結串列,會這麼寫:
struct node
{
    
struct node *next;
    data_t data;
}
其中的data假設是連結串列中元素存放的資料.然後針對這個連結串列寫一些相關操作的API.

假設下一個需求,連結串列存放的元素變了,那麼我們還需要定義一個新的資料結構,寫一些相關操作的API.

但是,其實我們需要做的事情都是類似:遍歷一個連結串列,按照某個條件定位到其中的一個元素,等等.有沒有辦法將操作比較特定資料的操作交給使用者,而封裝出一套滿足基本連結串列操作的API呢?

C++裡面的做法是STL,使用的是範型技術,在執行時才直到容器所要存放的資料元素的型別.而通過C++中的過載,函式物件等技術可以平滑的實現操作不同資料元素.

C中沒有這些技術,用STL的方式恐怕是走不通了.

於是,核心採用了另一種方法解決這個問題.

核心中實現的連結串列資料結構是這樣的:
struct
 list_head {
    
struct list_head *next, *prev;
};
可見,這個連結串列中只有分別指向前一個和後一個元素的指標,而沒有特定的型別.也就是說,這個資料型別關注的僅僅是連結串列本身的東西,與具體的資料無關.

當需要使用連結串列的時候,可以這樣來:
struct node
{
    
struct list_head link;
    data_t data;
}
那麼,如何根據這個link定位到所需要管理的資料呢?

核心中定義了這麼一個巨集:
#define container_of(ptr, type, member) \
    ((type 
*)((char
*)(ptr)-(unsigned long)(&((type *)0)->member)))
這個巨集的作用是容器型別type中有一個名為member的list_head元素,要根據這個元素的指標(ptr)得到存放它的type型別的物件的地址.

一步一步看這個巨集:
1) &((type *)0)->member)
從C的角度出發, 假設結構體node中有一個成員data, 那麼對於一個指向結構體node的指標p來說,
p->data與p的地址相差為data這個域在結構體node中的偏移量.
於是,&(p->member)就是type型別的指標p中的成員member的地址
,而這個地址是p的地址+member成員在這個結構體中的偏移,
當這個p變成了0之後,自然就得出了member成員在結構體type中的偏移量.

所以,&((type *)0)->member)獲得了結構體type中成員member的偏移量.

2) (char*)(ptr)-(unsigned long)(&((type *)0)->member))
這裡ptr是list_head的指標,也就是member成員的指標,因此兩者相減得到了存放member的type結構體的指標.

3)
((type *)((char*)(ptr)-(unsigned long)(&((type *)0)->member)))
最後在前面加上一個型別轉換,將前面得到的指標轉換成type型別.

這就是核心中根據list_head指標得到容納它的容器地址的魔法.

理解了這個,理解核心中的連結串列操作也就不再難.


接著看hlist,首先看看核心中的定義:
struct hlist_head {
    struct hlist_node *first;
};

struct hlist_node {
    struct hlist_node *next, **pprev;
};
這個資料結構與一般的hash-list資料結構定義有以下的區別:
1) 首先,hash的頭節點僅存放一個指標,也就是first指標,指向的是list的頭結點,沒有tail指標也就是指向list尾節點的指標,這樣的考慮是為了節省空間--尤其在hash bucket很大的情況下可以節省一半的指標空間.

2) list的節點有兩個指標,但是需要注意的是pprev是指標的指標,它指向的是前一個節點的next指標(見下圖).

現在疑問來了:為什麼pprev不是prev也就是一個指標,用於簡單的指向list的前一個指標呢?這樣即使對於first而言,它可以將prev指標指向list的尾結點.

主要是基於以下幾個考慮:
1) hash-list中的list一般元素不多(如果太多了一般是設計出現了問題),即使遍歷也不需要太大的代價,同時需要得到尾結點的需求也不多.
2) 如果對於一般節點而言,prev指向的是前一個指標,而對於first也就是hash的第一個元素而言prev指向的是list的尾結點,那麼在刪除一個元素的時候還需要判斷該節點是不是first節點進行處理.而在hlist提供的刪除節點的API中,並沒有帶上hlist_head這個引數,因此做這個判斷存在難度.
3) 以上兩點說明了為什麼不使用prev,現在來說明為什麼需要的是pprev,也就是一個指向指標的指標來儲存前一個節點的next指標--因為這樣做即使在刪除的節點是first節點時也可以通過*pprev = next;直接修改指標的指向.來看刪除一個節點和修改list頭結點的兩個API:
static inline void hlist_add_head(struct hlist_node *n, struct hlist_head *h)
{
    
struct hlist_node *first = h->first;
    n
->next = first;
    
if (first)
        first
->pprev =&n->next;
    h
->first = n;
    n
->pprev =&h->first; //此時n是hash的first指標,因此它的pprev指向的是hash的first指標的地址
}

static inline void __hlist_del(struct hlist_node *n)
{
    
struct hlist_node *next = n->next;
    
struct hlist_node **pprev = n->pprev;
    
*pprev = next; // pprev指向的是前一個節點的next指標,而當該節點是first節點時指向自己,因此兩種情況下不論該節點是一般的節點還是頭結點都可以通過這個操作刪除掉所需刪除的節點if (next)
        next
->pprev = pprev;
}



參考資料:
1)http://blog.chinaunix.net/u/12592/showart.php?id=451619
我對裡面的示意圖做了一下修改,主要是將list頭結點的pprev指標指向hash的first指標地址.這樣看上去更明白一些.
2)http://linux.chinaunix.net/bbs/viewthread.php?tid=1032772