【Linux】淺談Linux下的PCB—task_struct結構體
1.1 程序的概念
我之前在作業系統這門課中學過的有關程序的概念如下:
從作業系統層面上講:程序是程式的一次執行過程,是系統進行資源分配和處理機排程的一個獨立單位。程序的結構特性:程序=程式段+資料段+程序控制塊。程序的三種基本狀態:
對於一個程式來說,是不是隻要不在執行狀態,就一定不是程序呢?
不是。假如在單處理機的系統中,一次只能執行一個程序,即只有一個程序處於執行狀態,那麼其他的被載入到記憶體的程式(已經獲得了除處理機之外的所需的全部資源),
也是程序。
從核心的層面上講:程序擔當分配系統資源(包括記憶體等)的實體。 程序的兩個基本元素是程式程式碼(可能與其他程序共享)和與程式碼相關聯的資料集(這個是私有的)。這與程序的結構特性是一樣的:程序=程式段+資料段+程序控制塊。“。資料集就是指的是資料段和程序控制塊。其中程式碼段是共享的,資料段是私有的。
1.2 程序控制塊(PCB)
當一個程式載入到記憶體當中,計算機系統中就有了一個程序。每個程序在核心中都有一個程序控制塊(PCB)來維護自身程序的資訊,這個程序控制塊(PCB)是為了方便進行程序管理所設定的一個資料結構,裡面存放的是程序的相關資訊。也就是說,程序管理管理的是PCB。
程序控制塊(PCB)具體起什麼作用?在單處理機系統,我們每次只能執行一個程序,我們如何知道是哪個程序在執行?執行完這個程序之後,又需要去執行哪些程序?假如一個程序由於種種原因,需要被中斷,那麼之後再來執行此程序的時候,我們怎麼會知道之前執行到哪,等等情形,所以就需要程序控制塊。通過分析以上的種種情況,我們得出:程序控制塊至少應該包含程序標識(是程序的唯一標識,PID),還有程序的優先順序,記錄程序的上下文資訊,記錄程序下一次下一條指令的地址,程序中的程式的地址,等等。當作業系統要排程某程序去執行時,要從該程序的PCB中查詢程序的優先順序和現行狀態;當系統排程到某個程序時,要根據PCB中儲存的現行資訊先去恢復現場,然後再去修改程序的狀態,根據程式的地址,找到程式的位置,並開始執行;當程序由於某個原因需要暫停時,就必須將現行狀態儲存在PCB中,並記錄下一條指令的地址。可見,在程序的整個執行過程中,程序控制塊都起著非常重要的作用。
Linux核心的程序控制塊是task_struct結構體,task_struct是Linux核心的一種資料結構,它會被裝載到RAM裡並且包含著程序的資訊。每個程序都把它的資訊放在task_struct這個資料結構裡,task_struct裡包含了這些程序資訊:
識別符號、狀態、優先順序、程式計數器、記憶體指標、上下文資料、I/O狀態資訊、記賬資訊。
在Linux系統中,所有執行在系統裡的程序都是task_struct連結串列的形式存在核心裡。見下圖:
下面,我們開始剖析task_struct結構體。
1.3 task_struct結構體
centos6.5 Linux核心下,開啟/usr/src/kernels/2.6.32-431.el6.i686/include/linux/sched.h 可以找到task_struct的定義。
1>程序狀態(state)
volatile long state;
int exit_state;
程序可能出現的狀態如下:
#define TASK_RUNNING 0
#define TASK_INTERRUPTIBLE 1
#define TASK_UNINTERRUPTIBLE 2
#define __TASK_STOPPED 4
#define __TASK_TRACED 8
/* in tsk->exit_state */
#define EXIT_ZOMBIE 16
#define EXIT_DEAD 32
/* in tsk->state again */
#define TASK_DEAD 64
#define TASK_WAKEKILL 128
#define TASK_WAKING 256
2>程序識別符號(PID)
pid_t pid;//程序的唯一標識
pid_t tgid;// 執行緒組的領頭執行緒的pid成員的值
PID的取值範圍是0到32767,即系統中的程序數最大為32768個。
在Linux系統中,一個執行緒組中的所有執行緒使用和該執行緒組的領頭執行緒(該組中的第一個輕量級程序)相同的PID,並被存放在tgid成員中。(執行緒是程式執行的最小單位,程序是程式執行的基本單位。)
3>程序核心棧
void *stack
stack用來維護分配給程序的核心棧,核心棧的意義在於,程序task_struct所佔的記憶體是由核心動態分配的,確切的說就是核心根本不給task_struct分配記憶體,只給核心棧分配8KB記憶體,並且一部分會提供給task_struct使用。
task_struct結構體大約佔用的大小為1K左右,根據核心版本的不同,大小也會有差異。
所以,也就可以知道核心棧最大也就是7KB,否則,核心棧會覆蓋task_struct結構。
Linux核心通過thread_union聯合體來表示程序的核心棧.
union thread_union {
struct thread_info thread_info;
unsigned long stack[THREAD_SIZE/sizeof(long)];
};
4>標記
unsigned int flags; /* per process flags, defined below */
用來反映一個程序的狀態資訊,但不是執行狀態,用於核心識別程序當前的狀態,flags成員的可能取值如下:
/*
* Per process flags
*/
#define PF_ALIGNWARN 0x00000001 /* Print alignment warning msgs */
/* Not implemented yet, only for 486*/
#define PF_STARTING 0x00000002 /* being created */
#define PF_EXITING 0x00000004 /* getting shut down */
#define PF_EXITPIDONE 0x00000008 /* pi exit done on shut down */
#define PF_VCPU 0x00000010 /* I'm a virtual CPU */
#define PF_FORKNOEXEC 0x00000040 /* forked but didn't exec */
#define PF_MCE_PROCESS 0x00000080 /* process policy on mce errors */
#define PF_SUPERPRIV 0x00000100 /* used super-user privileges */
#define PF_DUMPCORE 0x00000200 /* dumped core */
#define PF_SIGNALED 0x00000400 /* killed by a signal */
#define PF_MEMALLOC 0x00000800 /* Allocating memory */
#define PF_FLUSHER 0x00001000 /* responsible for disk writeback */
#define PF_USED_MATH 0x00002000 /* if unset the fpu must be initialized before use */
#define PF_FREEZING 0x00004000 /* freeze in progress. do not account to load */
#define PF_NOFREEZE 0x00008000 /* this thread should not be frozen */
#define PF_FROZEN 0x00010000 /* frozen for system suspend */
#define PF_FSTRANS 0x00020000 /* inside a filesystem transaction */
#define PF_KSWAPD 0x00040000 /* I am kswapd */
#define PF_LESS_THROTTLE 0x00100000 /* Throttle me less: I clean memory */
#define PF_KTHREAD 0x00200000 /* I am a kernel thread */
#define PF_RANDOMIZE 0x00400000 /* randomize virtual address space */
#define PF_SWAPWRITE 0x00800000 /* Allowed to write to swap */
#define PF_SPREAD_PAGE 0x01000000 /* Spread page cache over cpuset */
#define PF_SPREAD_SLAB 0x02000000 /* Spread some slab caches over cpuset */
#define PF_THREAD_BOUND 0x04000000 /* Thread bound to specific cpu */
#define PF_MCE_EARLY 0x08000000 /* Early kill for mce process policy */
#define PF_MEMPOLICY 0x10000000 /* Non-default NUMA mempolicy */
#define PF_MUTEX_TESTER 0x20000000 /* Thread belongs to the rt mutex tester */
#define PF_FREEZER_SKIP 0x40000000 /* Freezer should not count it as freezeable */
#define PF_FREEZER_NOSIG 0x80000000 /* Freezer won't send signals to it */
5>表示程序親屬關係的成員
struct task_struct *real_arent; /* real parent process */
struct task_struct *parent; /* recipient of SIGCHLD, wait4() reports */
struct list_head children; /* list of my children */
struct list_head sibling; /* linkage in my parent's children list */
struct task_struct *group_leader; /* threadgroup leader */
在Linux系統中,所有程序之間都有著直接或間接地聯絡,每個程序都有其父程序,也可能有零個或多個子程序。擁有同一父程序的所有程序具有兄弟關係。
real_parent指向其父程序,如果建立它的父程序不再存在,則指向PID為1的init程序。
parent指向其父程序,當它終止時,必須向它的父程序傳送訊號。它的值通常與real_parent相同。
children表示連結串列的頭部,連結串列中的所有元素都是它的子程序。
sibling用於把當前程序插入到兄弟連結串列中。
group_leader指向其所在程序組的領頭程序。
6>程序排程
int prio, static_prio, normal_prio;
unsigned int rt_priority;
const struct sched_class *sched_class;
struct sched_entity se;
struct sched_rt_entity rt;
unsigned int policy;
cpumask_t cpus_allowed;
prio用於儲存動態優先順序。
static_prio用於儲存靜態優先順序,可以通過nice系統呼叫來進行修改。 normal_prio的值取決於靜態優先順序和排程策略。rt_priority用於儲存實時優先順序。 policy表示程序的排程策略。 這裡重點說明一下程序排程策略,我們來看下關於排程策略的成員:
unsigned int policy;
const struct sched_class *sched_class;
struct sched_entity se;
struct sched_rt_entity rt;
policy表示程序的排程策略,主要有以下五種:
#define SCHED_NORMAL 0//按照優先順序進行排程(有些地方也說是CFS排程器)
#define SCHED_FIFO 1//先進先出的排程演算法
#define SCHED_RR 2//時間片輪轉的排程演算法
#define SCHED_BATCH 3//用於非互動的處理機消耗型的程序
#define SCHED_IDLE 5//系統負載很低時的排程演算法
#define SCHED_RESET_ON_FORK 0x40000000
7> ptrace系統呼叫
unsigned int ptrace;
struct list_head ptraced;
struct list_head ptrace_entry;
ptrace是一種提供父程序控制子程序執行,並且可以檢查和改變它的核心image。當trace設定為0時不需要被跟蹤。8>效能診斷工具——Performance Event
#ifdef CONFIG_PERF_EVENTS
#ifndef __GENKSYMS__
void * __reserved_perf__;
#else
struct perf_event_context *perf_event_ctxp;
#endif
struct mutex perf_event_mutex;
struct list_head perf_event_list;
#endif
PerformanceEvent是一款隨 Linux 核心程式碼一同釋出和維護的效能診斷工具。這些成員用於幫PerformanceEvent分析程序的效能問題。
9>程序的地址空間
struct mm_struct *mm, *active_mm;
mm 程序所擁有的使用者空間的記憶體描述符
active_mm 指向程序執行時使用的記憶體描述符,對於普通的程序來說,mm和active_mm是一樣的,但是核心執行緒是沒有程序地址空間的,所以核心執行緒的mm是空的,所以需要初始化核心執行緒的active_mm |
10>時間與定時器
一個程序從建立到終止叫做該程序的生存期。程序在其生存期內使用CPU的時間,核心都要進行記錄,以便進行統計、計費等有關操作。程序耗費CPU的時間由兩部分組成:一是在使用者模式(或稱為使用者態)下耗費的時間、一是在系統模式(或稱為系統態)下耗費的時間。每個時鐘滴答,也就是每個時鐘中斷,核心都要更新當前程序耗費CPU的時間資訊。描述CPU時間的內容如下:
cputime_t utime, stime, utimescaled, stimescaled;
cputime_t gtime;
cputime_t prev_utime, prev_stime;
unsigned long nvcsw, nivcsw;
struct timespec start_time;
struct timespec real_start_time;
unsigned long min_flt, maj_flt;
struct task_cputime cputime_expires;
struct list_head cpu_timers[3];
struct list_head run_list;
unsigned long timeout;//當前已使用的時間(與開始時間的差值)
unsigned int time_slice;//程序的時間片的大小
int nr_cpus_allowed;
程序有三種類型的定時器:實時定時器、虛擬定時器和概況定時器。這三種定時器的特徵共有三個:到期時間、定時間隔、要觸發的事件。
11>判斷標誌
//用於程序判斷標誌
int exit_state;
int exit_code, exit_signal;
int pdeath_signal;
unsigned int personality;
unsigned did_exec:1;
unsigned in_execve:1;
unsigned in_iowait:1;
unsigned sched_reset_on_fork:1;
exit_state 程序終止的狀態
exit_code 設定程序的終止代號
exit_signal 設定為-1的時候表示是某個執行緒組當中的一員,只有當執行緒組的最後一個成員終止時,才會產生型號給父程序
pdeath_signal 用來判斷父程序終止時的訊號
12>訊號處理資訊
struct signal_struct *signal; //指向程序訊號描述符
struct sighand_struct *sighand; //指向程序訊號處理程式描述符
sigset_t blocked, real_blocked; //阻塞訊號的掩碼
sigset_t saved_sigmask;
struct sigpending pending; //程序上還需要處理的訊號
unsigned long sas_ss_sp; //訊號處理程式備用堆疊的地址
size_t sas_ss_size; //訊號處理程式的堆疊的地址
13>檔案系統資訊
程序可以開啟或關閉檔案,檔案屬於系統資源,Linux核心要對程序使用檔案的情況進行記錄。task_struct結構中有兩個資料結構用於描述程序與檔案相關的資訊。其中,fs_struct中描述了兩個VFS索引節點,這兩個索引節點叫做root和pwd。file_struct結構用來記錄了程序開啟的檔案的描述符。
//檔案系統資訊結構體
struct fs_struct *fs;
//開啟檔案相關資訊結構體
struct files_struct *files;
struct fs_struct *fs 程序可執行映象所在的檔案系統
struct files_struct *files 程序當前開啟的檔案
14>task_struct的完整定義及註釋
struct task_struct {
//程序狀態(-1就緒態,0執行態,>0停止態)
volatile long state; /* -1 unrunnable, 0 runnable, >0 stopped */
//程序核心棧
void *stack;
//有幾個程序只在使用此結構
atomic_t usage;
//標記
unsigned int flags; /* per process flags, defined below */
//ptrace系統呼叫,關於實現斷點除錯,跟蹤程序執行。
unsigned int ptrace;
//鎖的深度
int lock_depth; /* BKL lock depth */
//SMP實現無加鎖的程序切換
#ifdef CONFIG_SMP
#ifdef __ARCH_WANT_UNLOCKED_CTXSW
int oncpu;
#endif
#endif
//關於程序排程
int prio, static_prio, normal_prio;
//優先順序
unsigned int rt_priority;
//關於程序
const struct sched_class *sched_class;
struct sched_entity se;
struct sched_rt_entity rt;
//preempt_notifier結構體連結串列
#ifdef CONFIG_PREEMPT_NOTIFIERS
/* list of struct preempt_notifier: */
struct hlist_head preempt_notifiers;
#endif
/*
* fpu_counter contains the number of consecutive context switches
* that the FPU is used. If this is over a threshold, the lazy fpu
* saving becomes unlazy to save the trap. This is an unsigned char
* so that after 256 times the counter wraps and the behavior turns
* lazy again; this to deal with bursty apps that only use FPU for
* a short time
*/
//FPU使用計數
unsigned char fpu_counter;
//塊裝置I/O層的跟蹤工具
#ifdef CONFIG_BLK_DEV_IO_TRACE
unsigned int btrace_seq;
#endif
//程序排程策略相關的欄位
unsigned int policy;
cpumask_t cpus_allowed;
//RCU同步原語
#ifdef CONFIG_TREE_PREEMPT_RCU
int rcu_read_lock_nesting;
char rcu_read_unlock_special;
struct rcu_node *rcu_blocked_node;
struct list_head rcu_node_entry;
#endif /* #ifdef CONFIG_TREE_PREEMPT_RCU */
//用於排程器統計程序執行資訊
#if defined(CONFIG_SCHEDSTATS) || defined(CONFIG_TASK_DELAY_ACCT)
struct sched_info sched_info;
#endif
//用於構架程序連結串列
struct list_head tasks;
struct plist_node pushable_tasks;
//關於程序的地址空間,指向程序的地址空間。(連結串列和紅黑樹)
struct mm_struct *mm, *active_mm;
/* task state */
//程序狀態引數
int exit_state;
//退出訊號處理
int exit_code, exit_signal;
//接收父程序終止的時候會發送訊號
int pdeath_signal; /* The signal sent when the parent dies */
/* ??? */
unsigned int personality;
unsigned did_exec:1;
unsigned in_execve:1; /* Tell the LSMs that the process is doing an
* execve */
unsigned in_iowait:1;
/* Revert to default priority/policy when forking */
unsigned sched_reset_on_fork:1;
//程序pid,父程序ppid。
pid_t pid;
pid_t tgid;
//防止核心堆疊溢位
#ifdef CONFIG_CC_STACKPROTECTOR
/* Canary value for the -fstack-protector gcc feature */
unsigned long stack_canary;
#endif
/*
* pointers to (original) parent process, youngest child, younger sibling,
* older sibling, respectively. (p->father can be replaced with
* p->real_parent->pid)
*/
//這部分是用來進行維護程序之間的親屬關係的。
//初始化父程序
struct task_struct *real_parent; /* real parent process */
//接納終止的程序
struct task_struct *parent; /* recipient of SIGCHLD, wait4() reports */
/*
* children/sibling forms the list of my natural children
*/
//維護子程序連結串列
struct list_head children; /* list of my children */
//兄弟程序連結串列
struct list_head sibling; /* linkage in my parent's children list */
//執行緒組組長
struct task_struct *group_leader; /* threadgroup leader */
/*
* ptraced is the list of tasks this task is using ptrace on.
* This includes both natural children and PTRACE_ATTACH targets.
* p->ptrace_entry is p's link on the p->parent->ptraced list.
*/
//ptrace,系統呼叫,關於斷點除錯。
struct list_head ptraced;
struct list_head ptrace_entry;
//PID與PID散列表的聯絡
/* PID/PID hash table linkage. */
struct pid_link pids[PIDTYPE_MAX];
//維護一個連結串列,裡面有該程序所有的執行緒
struct list_head thread_group;
//do_fork()函式
struct completion *vfork_done; /* for vfork() */
int __user *set_child_tid; /* CLONE_CHILD_SETTID */
int __user *clear_child_tid; /* CLONE_CHILD_CLEARTID */
//描述CPU時間的內容
//utime是使用者態下的執行時間
//stime是核心態下的執行時間
cputime_t utime, stime, utimescaled, stimescaled;
cputime_t gtime;
cputime_t prev_utime, prev_stime;
//上下文切換計數
unsigned long nvcsw, nivcsw; /* context switch counts */
struct timespec start_time; /* monotonic time */
struct timespec real_start_time; /* boot based time */
/* mm fault and swap info: this can arguably be seen as either mm-specific or thread-specific */
//缺頁統計
unsigned long min_flt, maj_flt;
struct task_cputime cputime_expires;
struct list_head cpu_timers[3];
/* process credentials */
//程序身份憑據
const struct cred *real_cred; /* objective and real subjective task
* credentials (COW) */
const struct cred *cred; /* effective (overridable) subjective task
* credentials (COW) */
struct mutex cred_guard_mutex; /* guard against foreign influences on
* credential calculations
* (notably. ptrace) */
struct cred *replacement_session_keyring; /* for KEYCTL_SESSION_TO_PARENT */
//去除路徑以後的可執行檔名稱,程序名
char comm[TASK_COMM_LEN]; /* executable name excluding path
- access with [gs]et_task_comm (which lock
it with task_lock())
- initialized normally by setup_new_exec */
/* file system info */
//檔案系統資訊
int link_count, total_link_count;
#ifdef CONFIG_SYSVIPC
/* ipc stuff */
//程序通訊
struct sysv_sem sysvsem;
#endif
#ifdef CONFIG_DETECT_HUNG_TASK
/* hung task detection */
unsigned long last_switch_count;
#endif
//該程序在特點CPU下的狀態
/* CPU-specific state of this task */
struct thread_struct thread;
//檔案系統資訊結構體
/* filesystem information */
struct fs_struct *fs;
//開啟檔案相關資訊結構體
/* open file information */
struct files_struct *files;
/* namespaces */
//名稱空間:
struct nsproxy *nsproxy;
/* signal handlers */
//關於進行訊號處理
struct signal_struct *signal;
struct sighand_struct *sighand;
sigset_t blocked, real_blocked;
sigset_t saved_sigmask; /* restored if set_restore_sigmask() was used */
struct sigpending pending;
unsigned long sas_ss_sp;
size_t sas_ss_size;
int (*notifier)(void *priv);
void *notifier_data;
sigset_t *notifier_mask;
//程序審計
struct audit_context *audit_context;
#ifdef CONFIG_AUDITSYSCALL
uid_t loginuid;
unsigned int sessionid;
#endif
seccomp_t seccomp;
#ifdef CONFIG_UTRACE
struct utrace *utrace;
unsigned long utrace_flags;
#endif
//執行緒跟蹤組
/* Thread group tracking */
u32 parent_exec_id;
u32 self_exec_id;
/* Protection of (de-)allocation: mm, files, fs, tty, keyrings, mems_allowed,
* mempolicy */
spinlock_t alloc_lock;
//中斷
#ifdef CONFIG_GENERIC_HARDIRQS
/* IRQ handler threads */
struct irqaction *irqaction;
#endif
//task_rq_lock函式所使用的鎖
/* Protection of the PI data structures: */
spinlock_t pi_lock;
//基於PI協議的等待互斥鎖
#ifdef CONFIG_RT_MUTEXES
/* PI waiters blocked on a rt_mutex held by this task */
struct plist_head pi_waiters;
/* Deadlock detection and priority inheritance handling */
struct rt_mutex_waiter *pi_blocked_on;
#endif
//死鎖檢測
#ifdef CONFIG_DEBUG_MUTEXES
/* mutex deadlock detection */
struct mutex_waiter *blocked_on;
#endif
//中斷
#ifdef CONFIG_TRACE_IRQFLAGS
unsigned int irq_events;
int hardirqs_enabled;
unsigned long hardirq_enable_ip;
unsigned int hardirq_enable_event;
unsigned long hardirq_disable_ip;
unsigned int hardirq_disable_event;
int softirqs_enabled;
unsigned long softirq_disable_ip;
unsigned int softirq_disable_event;
unsigned long softirq_enable_ip;
unsigned int softirq_enable_event;
int hardirq_context;
int softirq_context;
#endif
//lockdep
#ifdef CONFIG_LOCKDEP
# define MAX_LOCK_DEPTH 48UL
u64 curr_chain_key;
int lockdep_depth;
unsigned int lockdep_recursion;
struct held_lock held_locks[MAX_LOCK_DEPTH];
gfp_t lockdep_reclaim_gfp;
#endif
//日誌檔案
/* journalling filesystem info */
void *journal_info;
/* stacked block device info */
//塊裝置連結串列
struct bio *bio_list, **bio_tail;
/* VM state */
//虛擬記憶體狀態,記憶體回收
struct reclaim_state *reclaim_state;
//存放塊裝置I/O流量資訊
struct backing_dev_info *backing_dev_info;
//I/O排程器所用資訊
struct io_context *io_context;
unsigned long ptrace_message;
siginfo_t *last_siginfo; /* For ptrace use. */
//記錄程序I/O計數
struct task_io_accounting ioac;
#if defined(CONFIG_TASK_XACCT)
u64 acct_rss_mem1; /* accumulated rss usage */
u64 acct_vm_mem1; /* accumulated virtual memory usage */
cputime_t acct_timexpd; /* stime + utime since last update */
#endif
//CPUSET功能
#ifdef CONFIG_CPUSETS
nodemask_t mems_allowed; /* Protected by alloc_lock */
#ifndef __GENKSYMS__
/*
* This does not change the size of the struct_task(2+2+4=4+4)
* so the offsets of the remaining fields are unchanged and
* therefore the kABI is preserved. Only the kernel uses
* cpuset_mem_spread_rotor and cpuset_slab_spread_rotor so
* it is safe to change it to use shorts instead of ints.
*/
unsigned short cpuset_mem_spread_rotor;
unsigned short cpuset_slab_spread_rotor;
int mems_allowed_change_disable;
#else
int cpuset_mem_spread_rotor;
int cpuset_slab_spread_rotor;
#endif
#endif
//Control Groups
#ifdef CONFIG_CGROUPS
/* Control Group info protected by css_set_lock */
struct css_set *cgroups;
/* cg_list protected by css_set_lock and tsk->alloc_lock */
struct list_head cg_list;
#endif
//futex同步機制
#ifdef CONFIG_FUTEX
struct robust_list_head __user *robust_list;
#ifdef CONFIG_COMPAT
struct compat_robust_list_head __user *compat_robust_list;
#endif
struct list_head pi_state_list;
struct futex_pi_state *pi_state_cache;
#endif
//關於記憶體檢測工具Performance Event
#ifdef CONFIG_PERF_EVENTS
#ifndef __GENKSYMS__
void * __reserved_perf__;
#else
struct perf_event_context *perf_event_ctxp;
#endif
struct mutex perf_event_mutex;
struct list_head perf_event_list;
#endif
//非一致記憶體訪問
#ifdef CONFIG_NUMA
struct mempolicy *mempolicy; /* Protected by alloc_lock */
short il_next;
#endif
//檔案系統互斥資源
atomic_t fs_excl; /* holding fs exclusive resources */
//RCU連結串列
struct rcu_head rcu;
/*
* cache last used pipe for splice
*/
//管道
struct pipe_inode_info *splice_pipe;
//延遲計數
#ifdef CONFIG_TASK_DELAY_ACCT
struct task_delay_info *delays;
#endif
#ifdef CONFIG_FAULT_INJECTION
int make_it_fail;
#endif
struct prop_local_single dirties;
#ifdef CONFIG_LATENCYTOP
int latency_record_count;
struct latency_record latency_record[LT_SAVECOUNT];
#endif
/*
* time slack values; these are used to round up poll() and
* select() etc timeout values. These are in nanoseconds.
*/
//time slack values,常用於poll和select函式
unsigned long timer_slack_ns;
unsigned long default_timer_slack_ns;
//socket控制訊息
struct list_head *scm_work_list;
#ifdef CONFIG_FUNCTION_GRAPH_TRACER
//ftrace跟蹤器
/* Index of current stored adress in ret_stack */
int curr_ret_stack;
/* Stack of return addresses for return function tracing */
struct ftrace_ret_stack *ret_stack;
/* time stamp for last schedule */
unsigned long long ftrace_timestamp;
/*
* Number of functions that haven't been traced
* because of depth overrun.
*/
atomic_t trace_overrun;
/* Pause for the tracing */
atomic_t tracing_graph_pause;
#endif
#ifdef CONFIG_TRACING
/* state flags for use by tracers */
unsigned long trace;
/* bitmask of trace recursion */
unsigned long trace_recursion;
#endif /* CONFIG_TRACING */
/* reserved for Red Hat */
unsigned long rh_reserved[2];
#ifndef __GENKSYMS__
struct perf_event_context *perf_event_ctxp[perf_nr_task_contexts];
#ifdef CONFIG_CGROUP_MEM_RES_CTLR /* memcg uses this to do batch job */
struct memcg_batch_info {
int do_batch; /* incremented when batch uncharge started */
struct mem_cgroup *memcg; /* target memcg of uncharge */
unsigned long bytes; /* uncharged usage */
unsigned long memsw_bytes; /* uncharged mem+swap usage */
} memcg_batch;
#endif
#endif
};
參考: