資料包接收系列 — NAPI的原理和實現

阿新 • • 發佈：2019-01-04

本文主要內容：簡單分析NAPI的原理和實現。

核心版本：2.6.37

Author：zhangskd @ csdn

概述

NAPI是linux新的網絡卡資料處理API，據說是由於找不到更好的名字，所以就叫NAPI(New API)，在2.5之後引入。

簡單來說，NAPI是綜合中斷方式與輪詢方式的技術。

中斷的好處是響應及時，如果資料量較小，則不會佔用太多的CPU事件；缺點是資料量大時，會產生過多中斷，

而每個中斷都要消耗不少的CPU時間，從而導致效率反而不如輪詢高。輪詢方式與中斷方式相反，它更適合處理

大量資料，因為每次輪詢不需要消耗過多的CPU時間；缺點是即使只接收很少資料或不接收資料時，也要佔用CPU

時間。

NAPI是兩者的結合，資料量低時採用中斷，資料量高時採用輪詢。平時是中斷方式，當有資料到達時，會觸發中斷

處理函式執行，中斷處理函式關閉中斷開始處理。如果此時有資料到達，則沒必要再觸發中斷了，因為中斷處理函

數中會輪詢處理資料，直到沒有新資料時才打開中斷。

很明顯，資料量很低與很高時，NAPI可以發揮中斷與輪詢方式的優點，效能較好。如果資料量不穩定，且說高不高

說低不低，則NAPI則會在兩種方式切換上消耗不少時間，效率反而較低一些。

實現

來看下NAPI和非NAPI的區別：

(1) 支援NAPI的網絡卡驅動必須提供輪詢方法poll()。

(2) 非NAPI的核心介面為netif_rx()，NAPI的核心介面為napi_schedule()。

(3) 非NAPI使用共享的CPU佇列softnet_data->input_pkt_queue，NAPI使用裝置記憶體(或者

裝置驅動程式的接收環)。

(1) NAPI裝置結構

/* Structure for NAPI scheduling similar to tasklet but with weighting */

struct napi_struct {
    /* The poll_list must only be managed by the entity which changes the
     * state of the NAPI_STATE_SCHED bit. This means whoever atomically
     * sets that bit can add this napi_struct to the per-cpu poll_list, and
     * whoever clears that bit can remove from the list right before clearing the bit.
     */
    struct list_head poll_list; /* 用於加入處於輪詢狀態的裝置佇列 */
    unsigned long state; /* 裝置的狀態 */
    int weight; /* 每次處理的最大數量，非NAPI預設為64 */
    int (*poll) (struct napi_struct *, int); /* 此裝置的輪詢方法，非NAPI為process_backlog() */

#ifdef CONFIG_NETPOLL
    ...
#endif

    unsigned int gro_count;
    struct net_device *dev;
    struct list_head dev_list;
    struct sk_buff *gro_list;
    struct sk_buff *skb;
};

(2) 初始化

初始napi_struct例項。

void netif_napi_add(struct net_device *dev, struct napi_struct *napi,
        int (*poll) (struct napi_struct *, int), int weight)
{
    INIT_LIST_HEAD(&napi->poll_list);
    napi->gro_count = 0;
    napi->gro_list = NULL;
    napi->skb = NULL;
    napi->poll = poll; /* 裝置的poll函式 */
    napi->weight = weight; /* 裝置每次poll能處理的資料包個數上限 */

    list_add(&napi->dev_list, &dev->napi_list); /* 加入裝置的napi_list */
    napi->dev = dev; /* 所屬裝置 */

#ifdef CONFIG_NETPOLL
    spin_lock_init(&napi->poll_lock);
    napi->poll_owner = -1;
#endif
    set_bit(NAPI_STATE_SCHED, &napi->state); /* 設定NAPI標誌位 */
}

(3) 排程

在網絡卡驅動的中斷處理函式中呼叫napi_schedule()來使用NAPI。

/**
 * napi_schedule - schedule NAPI poll
 * @n: napi context
 * Schedule NAPI poll routine to be called if it is not already running.
 */

static inline void napi_schedule(struct napi_struct *n)
{
    /* 判斷是否可以排程NAPI */
    if (napi_schedule_prep(n))
        __napi_schedule(n);
}

判斷NAPI是否可以排程。如果NAPI沒有被禁止，且不存在已被排程的NAPI，

則允許排程NAPI，因為同一時刻只允許有一個NAPI poll instance。

/**
 * napi_schedule_prep - check if napi can be scheduled
 * @n: napi context
 * Test if NAPI routine is already running, and if not mark it as running.
 * This is used as a condition variable insure only one NAPI poll instance runs.
 * We also make sure there is no pending NAPI disable.
 */

static inline int napi_schedule_prep(struct napi_struct *n)
{
    return !napi_disable_pending(n) && !test_and_set_bit(NAPI_STATE_SCHED, &n->state);
}
 
static inline int napi_disable_pending(struct napi_struct *n)
{
    return test_bit(NAPI_STATE_DISABLE, &n->state);
} 

enum {
    NAPI_STATE_SCHED, /* Poll is scheduled */
    NAPI_STATE_DISABLE, /* Disable pending */
    NAPI_STATE_NPSVC, /* Netpoll - don't dequeue from poll_list */
};

NAPI的排程函式。把裝置的napi_struct例項新增到當前CPU的softnet_data的poll_list中，

以便於接下來進行輪詢。然後設定NET_RX_SOFTIRQ標誌位來觸發軟中斷。

void __napi_schedule(struct napi_struct *n)
{
    unsigned long flags;
    local_irq_save(flags);
    ____napi_schedule(&__get_cpu_var(softnet_data), n);
    local_irq_restore(flags);
}

static inline void ____napi_schedule(struct softnet_data *sd, struct napi_struct *napi)
{
    /* 把napi_struct新增到softnet_data的poll_list中 */
    list_add_tail(&napi->poll_list, &sd->poll_list);
    __raise_softirq_irqoff(NET_RX_SOFTIRQ); /* 設定軟中斷標誌位 */
}

(4) 輪詢方法

NAPI方式中的POLL方法由驅動程式提供，在通過netif_napi_add()加入napi_struct時指定。

在驅動的poll()中，從自身的佇列中獲取sk_buff後，如果網絡卡開啟了GRO，則會呼叫

napi_gro_receive()處理skb，否則直接呼叫netif_receive_skb()。

POLL方法應該和process_backlog()大體一致，多了一些具體裝置相關的部分。

(5) 非NAPI和NAPI處理流程對比

以下是非NAPI裝置和NAPI裝置的資料包接收流程對比圖：

NAPI方式在上半部中sk_buff是儲存在驅動自身的佇列中的，軟中斷處理過程中驅動POLL方法呼叫

netif_receive_skb()直接處理skb並提交給上層。

/**
 * netif_receive_skb - process receive buffer from network
 * @skb: buffer to process
 * netif_receive_skb() is the main receive data processing function.
 * It always succeeds. The buffer may be dropped during processing
 * for congestion control or by the protocol layers.
 * This function may only be called from softirq context and interrupts
 * should be enabled.
 * Return values (usually ignored):
 * NET_RX_SUCCESS: no congestion
 * NET_RX_DROP: packet was dropped
 */

int netif_receive_skb(struct sk_buff *skb)
{
    /* 記錄接收時間到skb->tstamp */
    if (netdev_tstamp_prequeue)
        net_timestamp_check(skb);
 
    if (skb_defer_rx_timestamp(skb))
        return NET_RX_SUCCESS;

#ifdef CONFIG_RPS
    ...
#else
    return __netif_receive_skb(skb);
#endif
}

__netif_receive_skb()在上篇blog中已分析過了，接下來就是網路層來處理接收到的資料包了。

資料包接收系列 — NAPI的原理和實現

本文主要內容：簡單分析NAPI的原理和實現。核心版本：2.6.37 Author：zhangskd @ csdn 概述 NAPI是linux新的網絡卡資料處理API，據說是由於找不到更好的名字，所以就叫NAPI(New API)，在2.5之後引入。簡單來說，NAPI

資料包接收系列 — 上半部實現（網絡卡驅動）

本文主要內容：網路資料包接收的上半部實現，主要分析網絡卡驅動相關部分。核心版本：2.6.37 Author：zhangskd @ csdn blog 網絡卡概述 (1) 網絡卡收包網線上的物理幀首先被網絡卡晶片獲取，網絡卡晶片會檢查物理幀的CRC，保證完整性。然後

vue資料雙向繫結的原理和vue-router路由的實現原理

vue實現雙向資料繫結的原理就是利用了 Object.defineProperty() 這個方法重新定義了物件獲取屬性值(get)和設定屬性值(set)的操作來實現的。在MDN上對該方法的說明是：Object.defineProperty() 方法會直接在一個物件上定義一

在MCU中，如何實現串列埠的不定長資料包接收？

在MCU的應用中，經常需要通過串列埠進行不定長資料包的傳輸。傳送方很簡單，不需特別的考慮，而接收

【動態規劃】0-1背包問題原理和實現

最大一個 get ++ string span ati 0-1背包問題 div 0 1背包——每種物品只能選0件或者1件 /** * weight[] = {2,3,4,5} * value[] = {3,4,5,7} * 求

資料結構（3）：佇列的原理和實現

完整程式碼拉到最底下一、介紹佇列顧名思義就像我們生活中排隊一樣，先進先出。如上圖所示，25、16、5、9依次在佇列中，按照順序拿出的資料也分別是25、26、5、9。二、實現過程及思路底層使用陣列來實現，實現的功能有插入資料到隊尾、移除隊首資料、檢視隊首資料、判斷佇列是否為空、判斷佇列是否存滿。

資料結構（4）：連結串列的原理和實現

上、簡單的單端連結串列完整程式碼向下拉連結串列是一種常用的資料結構，在插入和移除操作中有著優秀的表現，同為資料結構的陣列哭暈，其實陣列的訪問效率比連結串列高多了有木有。我們先看一下連結串列的樣子有同學可能要說了，這不就是我們生活中的交通工具——火車，沒錯連結串列的結構和下圖簡直就是一個模子刻出來的

動態替換Linux核心函數的原理和實現

c函數路徑 pla ges sta images 語句堆棧 mit 轉載：https://www.ibm.com/developerworks/cn/linux/l-knldebug/ 動態替換Linux核心函數的原理和實現在調試Linux核心模塊時，有時需要

Linux時間子系統之六：高精度定時器（HRTIMER）的原理和實現

3.4 size 屬於 running return repr 而是復雜度 ctu 上一篇文章，我介紹了傳統的低分辨率定時器的實現原理。而隨著內核的不斷演進，大牛們已經對這種低分辨率定時器的精度不再滿足，而且，硬件也在不斷地發展，系統中的定時器硬件的精度也越來越高，這也給

API Hook基本原理和實現

use 概率缺省後綴 origin gif object cati mov API Hook基本原理和實現 2009-03-14 20:09 windows系統下的編程，消息message的傳遞是貫穿其始終的。這個消息我們可以簡單理解為一個有特定

jsonp的原理和實現

pty 方法 www 三方庫 .get 設定部分 nbsp blog 什麽是JSONP？ javascript高級程序設計中是這樣介紹jsonp的: jsonp是JSON with padding(填充式JSON或參數式JSON )的簡寫，是應用JSON的一種新方法，在

詳解PHP文件下載的原理和實現

利用 ring php代碼按鈕功能 span 所有編號變量通常文件下載過程是十分簡單的，建立一個鏈接指向到目標文件就可以了。例如下面的鏈接： XML/HTML代碼 <a href=http://www.xxx.com/xxx.rar>點擊下載文件&

慕課網星級評分原理和實現（上）

方法 click down cti 原理 als row rep ava 源碼下載 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8">

express 如何上傳文件的原理和實現

rip .net 文件 note receiving 過濾 console 執行 sage express 上傳文件的原理和實現原理 formidable multer COS 1.原理 1.1 要想了解express上傳我們先看看 nodejs原生上傳是怎麽實現的

CSS 0.5px 細線邊框的原理和實現方式

bottom back 先決條件 device min style ati 而且 origin 　　細線邊框的具體實現方法有：偽元素縮放或漸變，box-shadow模擬，svg畫線，border-image裁剪等。要實現小於1px的線條，有個先決條件：屏幕的分辨率要足夠高，

[NLP] TextCNN模型原理和實現

puts 窗口 ima () weight ica alt fine NPU 1. 模型原理 1.1 論文 Yoon Kim在論文(2014 EMNLP) Convolutional Neural Networks for Sentence Classification

JAVA 動態代理原理和實現

ror binary lose ole jdk 動態代理參數 try lob rac 在 Java 中動態代理和代理都很常見，幾乎是所有主流框架都用到過的知識。在面試中也是經常被提到的話題，於是便總結了本文。 Java動態代理的基本原理為：被代理對象需要實現某個接口（這是

java中註解的原理和實現機制

登入許可權驗證之token驗證的原理和實現

原理後端不在儲存認證資訊，而是在使用者登入的時候生成一個token，然後返回給前端，前端進行儲存，在需要進行驗證的時候將token一併傳送到後端，後端進行驗證加密的方式：對稱加密和非對稱加密，對稱加密指的是加密解密使用同一個金鑰，非對稱加密使用公鑰和私鑰，加密用私鑰加密，解密用公鑰解密

登入的許可權驗證session的原理和實現

儲存方式原理: 登入成功後，儲存登入資訊到檔案/資料庫種，同時儲存建立時間和過期時間，下次驗證的時候取出來做驗證使用express-session中介軟體來進行session的操作 1.安裝express-session npm install express-sess

資料包接收系列 — NAPI的原理和實現

概述

實現

相關推薦