基於kernel2.5.43對第一版經典RCU實現的思考

阿新 • • 發佈：2019-01-05

最近在研究RCU機制，想從RCU的歷史源頭開始深入理解（追溯根源會有意想不到的收穫，至少可以從程式碼演進過程中領略大牛們的思想）。

想到這裡，網上也有很多和我一樣想法的人士，特別感謝這篇文章：

http://www.wowotech.net/kernel_synchronization/Linux-2-5-43-RCU.html

上述文章講解很詳細，內容都覆蓋全面。有興趣的朋友可以直接閱讀。

以下只是我的一些思考。

假設4核系統，那麼整個系統有以下地方涉及rcu處理（由於4核併發，下列每行對齊只是好看而已，call_rcu不一定每個核上都有呼叫）

cpu0	cpu1	cpu2	cpu3
tick中斷	tick中斷	tick中斷	tick中斷
-->>rcu_pending
-->>rcu_check_callbacks
taskset	taskset	taskset	taskset
-->>rcu_process_callbacks

call_rcu（x）	call_rcu（x）	call_rcu（x）	call_rcu（x）
-->>list_add_tail(&head->list, &RCU_nxtlist(cpu))

資料結構理解

struct rcu_ctrlblk {
	spinlock_t	mutex;		/* Guard this struct                  */
	long		curbatch;	/* Current batch number.	      */
	long		maxbatch;	/* Max requested batch number.        */
	unsigned long	rcu_cpu_mask; 	/* CPUs that need to switch in order  */
					/* for current batch to proceed.      */
};
struct rcu_data {
	long		qsctr;		 /* User-mode/idle loop etc. */
        long            last_qsctr;	 /* value of qsctr at beginning */
                                         /* of rcu grace period */
        long  	       	batch;           /* Batch # for current RCU batch */
        struct list_head  nxtlist;
        struct list_head  curlist;
} ____cacheline_aligned_in_smp;

rcu_ctrlblk個人認為有點像音樂演奏的指揮家，指揮著不同樂器演奏家（rcu_data），演奏家需要盯著（tick中斷）指揮家的節拍不停前進。

rcu_cpu_mask的每一位表示一個rcu_data。

curbatch表示當前正在處理的批次，每次通過一個Grace Period就會前進1。主要是和rcu_data的batch結合處理回撥。

個人認為在Grace Period到期前，rcu_data的batch永遠比curbatch大1。

maxbatch也是比curbatch大1而已。

batch和maxbatch有可能是一樣的。下面程式碼本cpu啟動一個新的Grace Period時，會呼叫rcu_start_batch更新maxbatch。

/*
		 * start the next batch of callbacks
		 */
		spin_lock(&rcu_ctrlblk.mutex);
		RCU_batch(cpu) = rcu_ctrlblk.curbatch + 1;
		rcu_start_batch(RCU_batch(cpu));
		spin_unlock(&rcu_ctrlblk.mutex);

static void rcu_start_batch(long newbatch)
{
	if (rcu_batch_before(rcu_ctrlblk.maxbatch, newbatch)) {
		rcu_ctrlblk.maxbatch = newbatch;
	}
	if (rcu_batch_before(rcu_ctrlblk.maxbatch, rcu_ctrlblk.curbatch) ||
	    (rcu_ctrlblk.rcu_cpu_mask != 0)) {
		return;
	}
	rcu_ctrlblk.rcu_cpu_mask = cpu_online_map;
}

rcu_data

每個核上的batch有可能都不一樣，最大差值是多少呢？是不是等於核數呢？

新的回撥只會插入到nxtlist連結串列，curlist連結串列會在Grace Period到期時執行。

要是能測試驗證一下就更好了。

Bug：hardirq_count() <= 1，這個判斷條件應該是 hardirq_count() <= (1 << HARDIRQ_SHIFT)，在2.5.45版本上修復。由於執行rcu_check_callbacks是在timer的interrupt handler中，因此hardirq_count() <= 1 這個判斷條件永遠不會成立。

void rcu_check_callbacks(int cpu, int user)
{
	if (user || 
	    (idle_cpu(cpu) && !in_softirq() && hardirq_count() <= 1))
		RCU_qsctr(cpu)++;
	tasklet_schedule(&RCU_tasklet(cpu));
}

ChangeLog-2.5.45：
<[email protected]>
	[PATCH] RCU idle detection fix
	
	Patch from Dipankar Sarma <[email protected]>
	
	There is a check in RCU for idle CPUs which signifies quiescent state
	(and hence no reference to RCU protected data) which was broken when
	interrupt counters were changed to use thread_info->preempt_count.
	
	Martin's 32 CPU machine with many idle CPUs was not completing any RCU
	grace period because RCU was forever waiting for idle CPUs to context
	switch.  Had the idle check worked, this would not have happened.  With
	no RCU happening, the dentries were getting "freed" (dentry stats
	showing that) but not getting returned to slab.  This would not show up
	in systems that are generally busy as context switches then would
	happen in all CPUs and the per-CPU quiescent state counter would get
	incremented during context switch.

patch-2.5.45：

 void rcu_check_callbacks(int cpu, int user)
 {
 	if (user || 
-	    (idle_cpu(cpu) && !in_softirq() && hardirq_count() <= 1))
+	    (idle_cpu(cpu) && !in_softirq() && 
+				hardirq_count() <= (1 << HARDIRQ_SHIFT)))
 		RCU_qsctr(cpu)++;
 	tasklet_schedule(&RCU_tasklet(cpu));
 }

另外還有以下幾篇:

Linux2.6.11版本：classic RCU的實現

http://www.wowotech.net/kernel_synchronization/linux2-6-11-RCU.html

RCU作者經典網頁：

http://www2.rdrop.com/users/paulmck/RCU/

基於kernel2.5.43對第一版經典RCU實現的思考

最近在研究RCU機制，想從RCU的歷史源頭開始深入理解（追溯根源會有意想不到的收穫，至少可以從程式碼演進過程中領略大牛們的思想）。想到這裡，網上也有很多和我一樣想法的人士，特別感謝這篇文章： http://www.wowotech.net/kernel_synchronization/Li

SpringMVC案例2----基於spring2.5的註解實現

turn ddl mon ret load getc inpu aspectj mysql 和上一篇一樣，首先看一下項目結構和jar包 web.xml <?xml version="1.0" encoding="UTF-8"?> <web-a

43.對象深度克隆

utf blog neo view lose splay cfa display aps 1 <!DOCTYPE html> 2 <html> 3 <head lang="en"> 4 <meta charset

J2SE基礎:5.面向對象的特性2

data 轉換 j2se 重載 padding 上轉型 span post 功能 Final的使用 final在類之前表示該類是終於類。表示該類不能再被繼承。 final在方法之前表示該方法是終於方法，該方法不能被不論什麽派生的子類覆蓋。

面向對象經典案例坦克大戰

菜單記錄沒有間隔 mes sets font 爆炸效果 private package Tank;import java.awt.*;import java.awt.event.ActionEvent;import java.awt.event.ActionListe

2018-3-5 面向對象

結果 stat 學習 turn clas 數據 on() 函數靜態屬性今天學習了有關“面向對象”的內容：傳統的面向對象：把將要完成的工作，一個步驟一個步驟的實現，最終完成目標。現代的面向對象：把要做的事情提前存起來，等到需要用的時候調用，相當於設計方法和方法的調用。

微信小程序基於騰訊雲對象存儲的圖片上傳

don format isp manager reg false serial key .net 在使用騰訊雲對象存儲之前，公司一直使用的是傳統的FTP的上傳模式，而隨著用戶量的不斷增加，FTP所暴露出來的問題也越來越多，1.傳輸效率低，上傳速度慢。2.時常

【神經網絡篇】--基於數據集cifa10的經典模型實例

cas 環境常用及其分享執行獨立 -- 解壓一、前述本文分享一篇基於數據集cifa10的經典模型架構和代碼。二、代碼 import tensorflow as tf import numpy as np import math import time fr

基於spring2.5的采用XML配置的spring MVC項目

ont encoding cte default 尚學堂 rri 導入jar包 request 事務 Spring MVC 背景介紹 Spring 框架提供了構建 Web 應用程序的全功能 MVC 模塊。使用 Spring 可插入的 MVC 架構，可以選擇是使用內

基於UDP的IP對IP的客戶端程序

pri ram using con 使用 UC spa ID ast #include "stdafx.h"#include<winsock2.h>#include<stdio.h>#include<string.h>#include&l

基於數值分析思想對多項式求值的原理和應用進行探究

數值分析 use com 相加 emp 要花 class RoCE size 摘要：多項式是由多個單項（符號項如：5x或者常數項4）通過四則運算組合起來的式子,如P(x)=2x^4+3x^3-3x^2+5x-1 一般的求解會將特定的x代入到上式中，一個一個的計算，共需要

Via瀏覽器 v3.4.5 又一款經典簡潔的安卓瀏覽器

Via瀏覽器是由國內開發者開發的一款安卓平臺上的極簡瀏覽器，它追求極簡，是極客之選。Via瀏覽器以極客思維為主線，化繁為簡，簡化過程，提升搜尋與瀏覽的效率，注重瀏覽體驗，乾淨利落，簡約不簡單。小體積的瀏覽器讓每個安卓機型都可以輕鬆駕馭。麻雀雖小五臟俱全，Via瀏覽器常用功能一應俱全，對於高階的

【學習筆記】唐大仕—Java程序設計第5講深入理解Java語言之5.4 對象清除與垃圾回收

let 要求什麽 jdk1 style 1.10 垃圾 ati 內存 /** * 對象清除與垃圾回收 * @author cnRicky * @date 2018.11.10 */ 對象清除與垃圾回收對象清除我們知道：new創建對象那麽如何銷毀對象？ Java

基於Centos7.5搭建Docker環境

　　docker很火，基於容器化技術，實現一次編譯到執行。實現執行環境+服務的一鍵式打包！ 00、部署環境 centos7.5(基於vmware搭建的測試環境，可以跟網際網路互動，橋接方式聯網) docker-ce 18.x [[email protected] ~]# uname -aLi

IIS7.5配置對PHP的支援

以下環境是 Windows server2008R2 IIS7.5 一般情況下，windows server系統預設是僅支援IIS+asp 或 IIS+aspx 的搭配的，但是有時候我們的網站程式是php的。所以，我們就需要配置 IIS 對 PHP 的支援。

Python指令碼--基於正則表示式對檔案進行解析

Python指令碼--基於正則表示式對檔案進行解析首先需要了解正則表示式中的相應指令（compile、findall）,我對此的理解是compile相當於一個規則的制定者，將匹配的規則制定出來，後續具體的操作是findall的工作【選擇適當的規則

5.程式碼對齊（UVA1593）

程式碼對齊（UVA1593）題目簡單分析程式碼題目簡單分析題目的詳細內容可以在這個網站上看到，下面簡單說明一下題目要求。 [題意] 本題主要任務是對輸入的程式碼進行對齊，例如： start: integer; // be

Elam的caffe筆記之配置篇：基於CentOS6.5 python3.6 CUDA8.0 cudnnv5.1 opencv3.1 下的caffe配置

Elam的caffe筆記之配置篇：基於CentOS6.5 python3.6 CUDA8.0 cudnnv5.1 opencv3.1 下的caffe配置作為一個完完全全的linux小白，平時連cmd開啟資料夾都要百度的人，面對單獨配置caffe這個棘手任務，第一反應就是搜教程。

新手小白必知的5道Web前端經典面試題

想成功就業web前端工程師，想要能高薪就業，那麼除了好的web前端技能以外，還得有好的面試技巧，如果提前就瞭解更多企業的面試要求及面試題目，那麼可以讓我們的面試成功的機率大大的提高，今天就給大家分享5道經典的web前端面試題，相信可以祝大家一臂之力。

基於決策樹模型對 IRIS 資料集分類

基於決策樹模型對 IRIS 資料集分類文章目錄基於決策樹模型對 IRIS 資料集分類 1 python 實現載入資料集視覺化資料集分類和預測計算準確率 2 基於MATLA

基於kernel2.5.43對第一版經典RCU實現的思考

Linux2.6.11版本：classic RCU的實現

相關推薦