Android DNS之懲罰機制

阿新 • • 發佈：2018-12-11

資料結構

統計資訊同樣是基於網絡卡的，所以理所當然的，這些資訊儲存在了resolv_cache_info中，該結構中與統計有關的資訊如下：

struct resolv_cache_info {
    struct __res_params         params;
    //每個DNS伺服器地址都有一個自己的統計資訊
    struct __res_stats          nsstats[MAXNS];
};

統計引數的定義如下，這幾個引數的用法及其含義見下文分析：

/* per-netid configuration parameters passed from netd to the resolver */ 

struct __res_params {
    uint16_t sample_validity; // sample lifetime in s
    // threshold of success / total samples below which a server is considered broken
    uint8_t success_threshold; // 0: disable, value / 100 otherwise
    uint8_t min_samples; // min # samples needed for statistics to be considered meaningful 

    //__res_stats.samples中最多可以儲存多少個樣本，該值應該不能超過MAXNSSAMPLES，否則就陣列越界了
    uint8_t max_samples; // max # samples taken into account for statistics
};

統計資訊的定義如下：

/*
 * Resolver reachability statistics and run-time parameters.
 */
//稱之為統計樣本吧
struct __res_sample {
	//該值是DNS請求報文被髮送的時間，牆上時鐘表示
    time_t			at;    // time in s at which the sample was recorded 

    //如果收到了響應，那麼為請求耗時，單位為毫秒；如果沒有收到響應，那麼該值為0
    uint16_t			rtt;   // round-trip time in ms
    //響應報文中的返回碼
    uint8_t			rcode; // the DNS rcode or RCODE_XXX defined above
};

#define MAXNSSAMPLES		64	/* max # samples to store per server */

struct __res_stats {
    // 儲存樣本，作為環形陣列使用
    struct __res_sample		samples[MAXNSSAMPLES];
    // 當前環形陣列中儲存的贗本數
    uint8_t			sample_count;
    // 下一個樣本應該儲存到samples[]的哪個位置
    uint8_t			sample_next;
};

要強調的是，對於每個網絡卡，統計引數只有一套，但是統計資訊是根據DNS伺服器地址分別記錄的。

基本操作

初始化

初始化是在設定DNS伺服器地址的時候完成的，其中相關程式碼如下：

int
_resolv_set_nameservers_for_net(unsigned netid, const char** servers, unsigned numservers,
        const char *domains, const struct __res_params* params)
{
    pthread_once(&_res_cache_once, _res_cache_init);
    pthread_mutex_lock(&_res_cache_list_lock);

    //分配resolv_cache_info結構，當然包括統計資訊和統計引數
    _get_res_cache_for_net_locked(netid);

    if (cache_info != NULL) {
        uint8_t old_max_samples = cache_info->params.max_samples;
        if (params != NULL) {
        	//如果FWK有設定統計引數，那麼使用FWK指定的
            cache_info->params = *params;
        } else {
        	//FWK沒有指定，使用預設的
            _resolv_set_default_params(&cache_info->params);
        }

		//設定DNS地址或者修改了統計引數，那麼清除統計資訊
        if (!_resolv_is_nameservers_equal_locked(cache_info, servers, numservers)) {
            // Clear the NS statistics because the mapping to nameservers might have changed.
            _res_cache_clear_stats_locked(cache_info);
        } else if (cache_info->params.max_samples != old_max_samples) {
            // If the maximum number of samples changes, the overhead of keeping the most recent
            // samples around is not considered worth the effort, so they are cleared instead. All
            // other parameters do not affect shared state: Changing these parameters does not
            // invalidate the samples, as they only affect aggregation and the conditions under
            // which servers are considered usable.
            _res_cache_clear_stats_locked(cache_info);
        }
    }

    pthread_mutex_unlock(&_res_cache_list_lock);
    return 0;
}

清空統計資訊_resolv_set_default_params()

static void _res_cache_clear_stats_locked(struct resolv_cache_info* cache_info) {
    if (cache_info) {
    	//將每個server對應的統計全部去清零
        for (int i = 0 ; i < MAXNS ; ++i) {
            cache_info->nsstats->sample_count = cache_info->nsstats->sample_next = 0;
        }
    }
}

新增樣本

在res_nsend()中，如果查詢結束，會呼叫_resolv_cache_add_resolver_stats_sample()將樣本加入到cache中，程式碼如下：

int res_nsend(res_state statp,
	  const u_char *buf, int buflen, u_char *ans, int anssiz)

	//注意，這裡只統計第一輪的查詢結果
    /* Only record stats the first time we try a query. See above. */
    if (try == 0) {
        struct __res_sample sample;
        //用引數now、rcode、delay設定樣本sample
        _res_stats_set_sample(&sample, now, rcode, delay);
        //將樣本加入到快取中
        _resolv_cache_add_resolver_stats_sample(statp->netid, revision_id,
            ns, &sample, params.max_samples);
    }
}

void _resolv_cache_add_resolver_stats_sample( unsigned netid, int revision_id, int ns,
       const struct __res_sample* sample, int max_samples) {
    if (max_samples <= 0) return;

    pthread_mutex_lock(&_res_cache_list_lock);

    struct resolv_cache_info* info = _find_cache_info_locked(netid);
	//找到對應的cache，並且二者的revision_id是一致，這種比較是防止在一個DNS請求過程中DNS資訊被修改過
    if (info && info->revision_id == revision_id) {
        _res_cache_add_stats_sample_locked(&info->nsstats[ns], sample, max_samples);
    }

    pthread_mutex_unlock(&_res_cache_list_lock);
}

static void
_res_cache_add_stats_sample_locked(struct __res_stats* stats, const struct __res_sample* sample,
        int max_samples) {
    // Note: This function expects max_samples > 0, otherwise a (harmless) modification of the
    // allocated but supposedly unused memory for samples[0] will happen
    XLOG("%s: adding sample to stats, next = %d, count = %d", __FUNCTION__,
            stats->sample_next, stats->sample_count);
    //儲存當前樣本
    stats->samples[stats->sample_next] = *sample;
    //樣本數不能超過配置引數中指定的最大樣本數
    if (stats->sample_count < max_samples) {
        ++stats->sample_count;
    }
    //從這裡可以看出，stats->samples[]是作為環形陣列使用的，並且stats->sample_next指向的就是下一個要
    //賦值的樣本的索引
    if (++stats->sample_next >= max_samples) {
        stats->sample_next = 0;
    }
}

懲罰機制

前面介紹的都是統計資訊的資料結構以及它們是如何儲存的，但是還沒有看儲存這些資訊到底要幹什麼？這些資訊實際上會在res_nsend()中使用，下面先看程式碼實現，然後再來總結這種機制。

res_nsend()

res_nsend()中有如下程式碼片段：

int res_nsend(res_state statp, const u_char *buf, int buflen, u_char *ans, int anssiz)
{
	/*
	 * Send request, RETRY times, or until successful.
	 */
	for (try = 0; try < statp->retry; try++) {
	    struct __res_stats stats[MAXNS];
	    struct __res_params params;
        //獲取當前resolv_cache中的統計引數、統計資訊以及revision_id
	    int revision_id = _resolv_cache_get_resolver_stats(statp->netid, &params, stats);
        //下面的函式會決定各個DNS伺服器地址是否可用，是否可用都設定到usable_servers[]中
	    bool usable_servers[MAXNS];
	    android_net_res_stats_get_usable_servers(&params, stats, statp->nscount,
		    usable_servers);
		//在遍歷各個DNS伺服器地址時，如果已經標記該伺服器地址不可用，則直接跳過，
        //所以我們稱這種機制為懲罰機制(不喜勿噴)
	    for (ns = 0; ns < statp->nscount; ns++) {
			if (!usable_servers[ns])
            	continue;
            }
        }
    }
}

先來看看當前統計引數和統計資訊的獲取程式碼：

int
_resolv_cache_get_resolver_stats( unsigned netid, struct __res_params* params,
        struct __res_stats stats[MAXNS]) {
    int revision_id = -1;
    pthread_mutex_lock(&_res_cache_list_lock);

    struct resolv_cache_info* info = _find_cache_info_locked(netid);
    if (info) {
    	//完全正確，要獲取的資訊全部來自於resolv_cache_info
        memcpy(stats, info->nsstats, sizeof(info->nsstats));
        *params = info->params;
        revision_id = info->revision_id;
    }

    pthread_mutex_unlock(&_res_cache_list_lock);
    return revision_id;
}

下面重點來看到底是如何判斷DNS伺服器地址是否可用的。

DNS伺服器地址的可用性判定

void
android_net_res_stats_get_usable_servers(const struct __res_params* params,
        struct __res_stats stats[], int nscount, bool usable_servers[]) {
    //統計總共有多少個地址是可用的
    unsigned usable_servers_found = 0;
    for (int ns = 0; ns < nscount; ns++) {
    	//具體的一個伺服器地址是否可用有下面的函式決定
        bool usable = _res_stats_usable_server(params, &stats[ns]);
        if (usable) {
            ++usable_servers_found;
        }
        usable_servers[ns] = usable;
    }
    // If there are no usable servers, consider all of them usable.
    // TODO: Explore other possibilities, such as enabling only the best N servers, etc.
    //如註釋所述，如果上面的邏輯判斷所有的DNS地址都不可用，那麼為了保證至少有DNS伺服器地址可用，
    //這種情況下會將所有的地址都置為可用。顯然這是一種防止懲罰過度的手段
    if (usable_servers_found == 0) {
        for (int ns = 0; ns < nscount; ns++) {
            usable_servers[ns] = true;
        }
    }
}

單個DNS伺服器地址的可用性判定

bool _res_stats_usable_server(const struct __res_params* params, struct __res_stats* stats)
{
    int successes = -1;
    int errors = -1;
    int timeouts = -1;
    int internal_errors = -1;
    int rtt_avg = -1;
    time_t last_sample_time = 0;

    //該函式實際上是非常簡單的，就是統計stats中：DNS查詢成功的次數、查詢失敗次數、查詢超時次數、查詢過程中
    //發生了內部錯誤(快取區太小等)的次數、查詢成功時的平均RTT時延、最後一次新增統計樣本的時間戳
    android_net_res_stats_aggregate(stats, &successes, &errors, &timeouts, &internal_errors,
            &rtt_avg, &last_sample_time);

	//進行門限判斷
    if (successes >= 0 && errors >= 0 && timeouts >= 0) {
    	//總的DNS查詢次數，注意不包含內部錯誤，因為這種情況根本就不會發起DNS請求
        int total = successes + errors + timeouts;
		//1. 總的查詢次數超過了統計引數中配置的min_samples門限-----樣本要達到一定數量
        //2. 有查詢失敗的情況發生-----如果全部正確也確實沒有什麼要繼續判定的必要
        if (total >= params->min_samples && (errors > 0 || timeouts > 0)) {
        	//計算DNS查詢成功率，百分比
            int success_rate = successes * 100 / total;
			//如果成功率低於統計引數中設定的成功率門限，那麼需要懲罰該DNS伺服器地址
            if (success_rate < params->success_threshold) {
                // evNowTime() is used here instead of time() to stay consistent with the rest of
                // the code base
                time_t now = evNowTime().tv_sec;
                //如果從上次新增樣本到當前時間已經超過了要懲罰的時間，那麼就不需要懲罰了
                if (now - last_sample_time > params->sample_validity) {
                    // Note: It might be worth considering to expire old servers after their expiry
                    // date has been reached, however the code for returning the ring buffer to its
                    // previous non-circular state would induce additional complexity.
                    //雖然不懲罰了，但是該DNS服務其之前的統計資訊要清除
                    _res_stats_clear_samples(stats);
                } else {
                	//需要懲罰並且還沒有超過懲罰時間，那麼禁用該DNS伺服器地址
                    return 0;
                }
            }
        }
    }
    //其它所有的情況，該DNS伺服器地址都是可用的
    return 1;
}

從上面的程式碼中，可以清楚的看到統計引數的含義分別如下：

min_samples: 懲罰一個伺服器地址所需的最小樣本數； success_threshold: 如果一個伺服器地址的查詢成功率低於該閾值，那麼該地址將會被懲罰； sample_validity：如果一個地址要被懲罰，那麼應該懲罰多長時間，單位為秒。

max_samples: 該引數和懲罰機制無關，它控制一個伺服器地址最多可以儲存多少個樣本。

綜上，不難理解何為懲罰機制，其實其設計思想非常簡單，就是如果使用一個DNS伺服器地址查詢的成功率過低了，那麼就禁用該地址一段時間，這段懲罰時間內，不會在使用該DNS伺服器地址進行域名查詢。

Android DNS之懲罰機制

資料結構統計資訊同樣是基於網絡卡的，所以理所當然的，這些資訊儲存在了resolv_cache_info中，該結構中與統計有關的資訊如下： struct resolv_cache_info { struct __res_params pa

Android DNS之getaddrinfo()的實現

這篇筆記分析了庫函式getaddrinfo()的程式碼實現。原型解讀 int getaddrinfo(const char *hostname, const char *servname, const struct addrinfo *hints, struct addri

Android DNS之DNS引數設定

概述 ConnectivityService會通過netd將DNS引數設定到解析庫的cache中，設定介面是_resolv_set_nameservers_for_net()，後續在DNS查詢過程中，解析庫會從cache中獲取設定的DNS伺服器地址。資料結構

Android DNS之gethostbyname()的實現

原型解讀 struct hostent *gethostbyname(const char *name); 入參字串name可取的值分為三種類型：十進位制數字格式的IPv4地址十六進位制數字格式的IPv6地址域名返回值返回值為指向struct

Android 深入淺出之Binder機制

轉自：http://www.cnblogs.com/innost/archive/2011/01/09/1931456.html Android深入淺出之Binder機制一說明 Android系統最常見也是初學者最難搞明白的就是Binder了，很多很多的Service

深入理解Android Telephony 之RILD機制分析

RILD負責modem和RILJ端的通訊，資訊分兩種：unsolicited和solicited，前者是由modem主動上報的，諸如時區更新、通話狀態、網路狀態等訊息，後者是RILJ端發請求並需要modem反饋的資訊。RILJ與RILD之間的通訊由主執行緒s_t

Android DNS之查詢庫函式介面

概述這篇筆記總結下，為了實現域名<–>IP地址、服務名<–>埠號之間的轉換，系統到底對外提供了哪些介面。域名<–>IP地址轉換域名–>IP地址 gethostbyname() struct hostent *get

Android 深入淺出之 Binder機制

Android深入淺出之Binder機制一說明 Android系統最常見也是初學者最難搞明白的就是Binder了，很多很多的Service就是通過Binder機制來和客戶端通訊互動的。所以搞明白Binder的話，在很大程度上就能理解程式執行的流程。我們這裡將以Med

(轉，好文必須的)Android深入淺出之Binder機制

Android 最火框架XUtils之註解機制具體解釋

lean uci 修飾 row 多個 mes 數組 1.2 sans 在上一篇文章Android 最火的高速開發框架XUtils中簡介了xUtils的基本用法，這篇文章說一下xUtils裏面的註解原理。先來看一下xUtils裏面demo的代碼

Keepalived 之雙主模式+DNS輪詢機制實現高負載

location 記錄 ipa res 均衡 sta text 不一致 for 一、Keepalived雙主模式+DNS輪詢機制作用作用：在單主模式下，備機通常會以等待狀態放著，不接受任何數據，導致所有數據請求只往主機-負載均衡發送，做成資源浪費；而雙主模式，即創造兩個V

Android 學習之《第一行程式碼》第二版筆記（十一）詳解廣播機制（一）

一、廣播機制簡介 1. 四大元件之一 2. Android 提供了一套完整的API，允許應用程式自由地傳送和接收廣播。 A. 傳送廣播藉助Intent B. 接收廣播藉助廣播接收器（Broadcast Receiver） 3. 廣播型別： A. 標準廣播：完全非同步執行

Android 學習之《第一行程式碼》第二版筆記（十二）詳解廣播機制（二）

廣播的最佳實踐——實現強制下線功能思路：在介面上彈出一個對話方塊，讓使用者無法進行任何操作，必須點選對話方塊中的確定按鈕，然後回到登入介面即可。一、效果圖 1. 登入介面並輸入賬號密碼 2. 登陸後的介面 3. 強制下線 4. 退回登陸的介面

Android學習之基礎知識八—Android廣播機制

iss 所有系統運行 perm 情況 space dcom image 一、廣播機制簡介　　Android提供了一套完整的API，允許應用程序自由的發送和接受廣播，發送廣播借助於我們之前學過的：Intent，而接收廣播需要借助於廣播接收器（Broadcast Rece

Android 技能圖譜學習路線系列-Java基礎之反射機制

Java反射機制一、什麼是反射機制　　JAVA反射機制是在執行狀態中，對於任意一個類，都能夠知道這個類的所有屬性和方法；對於任意一個物件，都能夠呼叫它的任意方法和屬性；這種動態獲取資訊以及動態呼叫物件方法的功能稱為java語言的反射機制。　　二、反射機

我所理解的Android元件化之通訊機制

之前寫過一篇關於Android元件化的文章，《Android元件化框架設計與實踐》，之前沒看過的小夥伴可以先點選閱讀。那篇文章是從實戰中進行總結得來，是公司的一個真實專案進行元件化架構改造，粒度會分的更粗些，是對整體架構實踐進行相應的總結，裡面說了要打造一個元件化框架的話，需要從以下7個方面入手：程式碼解

Android面試系列之Handler機制篇

1.什麼是Handler？ Handler是可以通過傳送和處理Message和Runnable物件來關聯相應執行緒的MessageQueue。通常我們認為它是一種非同步機制。 a.可以讓對應的Message和Runnable在未來的某個時間點進行相應的處理。

android之桌布機制

android之桌布機制１.涉及核心類: １>ImageWallpaper.java(IW):繼承WallpaperService主要負責靜態桌布的draw處理; ２>WallpaperManager.java(WM):主要負

Android筆記之解決OkHttp解析dns超時時間無法設定的問題

問題使用OkHttp，裝置切換路由後，訪問網路出現長時間無響應，很久以後才丟擲UnknownHostException. 這明顯不是我們想要的，我們設定的connectTimeout屬性似乎對dns的解析不起作用如何解決我們先看看OkHttpClient有沒有關於Dns

Android之記憶體機制分析-Android堆和棧

　　Java 的堆是一個執行時資料區,類的(物件從中分配空間。這些物件通過new、newarray、anewarray和multianewarray等指令建立，它們不需要程式程式碼來顯式的釋放。堆是由垃圾回收來負責的，堆的優勢是可以動態地分配記憶體大小，生存期也不必事先告訴編譯器，因為它是在執行時動態分配記憶

Android DNS之懲罰機制

資料結構

基本操作

初始化

清空統計資訊_resolv_set_default_params()

新增樣本

懲罰機制

res_nsend()

DNS伺服器地址的可用性判定

單個DNS伺服器地址的可用性判定

相關推薦