segment fault 段錯誤 (core dumped)的起因分析！

阿新 • • 發佈：2019-02-06

核心使用記憶體描述符結構體表示程序的地址空間，該結構體包含了和程序地址空間有關的全部資訊。記憶體描述符由mm_struct結構體表示，定義在檔案<linux/sched.h>中。進程地址空間由每個程序的線性地址區（vm_area_struct）組成。通過核心，程序可以給自己的地址空間動態的新增或減少線性區域。如下圖是記憶體描述符mm_struct和線性區域描述符vm_area_struct的關係:

mm_users域記錄正在使用該地址的程序數目。比如，如果兩個程序共享該地址空間，那麼mm_users的值便等於2;mm_count域是mm_struct的結構體的主引用計數，只要

mm_users不為0，那麼mm_count值就等於1.當mm_users值減為0（兩個執行緒都退出）時，mm_count域的值才變為0。如果mm_count的值等於0，說明已經沒有任何指向該mm_struct結構體的引用了，這時該結構體會被銷燬。mmap和mm_rb這兩個不同的資料結構描述的物件是相同的：該地址空間中的全部記憶體區域。

mmap結構體最為連結串列，利於簡單，高效地遍歷所有元素；而mm_rb結構體作為紅-黑樹，更適合搜尋指定元素。所有的mm_struct結構體通過自身的mmlist域連線在一個雙向連結串列中，該連結串列的首元素是init_mm記憶體描述符，它代表0號

程序的地址空間。在程序的程序描述符中，mm域存放著該程序使用的記憶體描述符。copy_process函式利用copy_mm函式複製父程序的記憶體描述符。像vfork和clone系統呼叫指定的 CLONE_VM標誌的，僅僅需要在呼叫copy_mm()函式中將mm域指向其父程序的記憶體描述符就可以了：

if (clone_flags & CLONE_VM){
atomic_inc(&oldmm->mm_users);
mm = oldmm;
goto good_mm;
}

而fork系統呼叫產生的子程序中的mm_struct結構體實際是通過檔案kernel/fork.c中的alloc_mm()巨集從mm_cachep slab快取中分配得到的。通常，每個程序都有一個唯一的

mm_struct結構體，即唯一的程序地址空間。是否共享地址空間，幾乎是程序和Linux中所謂執行緒間本質上的唯一區別。

vm_start域指向線性區域的首地址，vm_end域指向尾地址之後的第一個位元組，也就是說,vm_start是線性區域的開始地址，vm_end是線性區域的結束地址。vm_mm域指向和VMA 相關的mm_struct結構體，注意每個VMA對其相關的mm_struct結構體來說都是唯一的，所以即使兩個獨立的程序將同一個檔案對映到各自的地址空間，他們分別都會有一個 vm_area_struct結構體來標誌自己的記憶體區域；但是如果兩個執行緒共享一個地址空間，那麼他們也同時共享其中的所有vm_area_struct結構體。

#include <linux/module.h>
#include <linux/init.h>
#include <linux/proc_fs.h>
#include <linux/list.h>
#include <linux/types.h>
#include <linux/sched.h>
int read_myproc(char *page, char **start, off_t off, int count, int *eof, void *data){
struct task_struct *p;
struct vm_area_struct *first;
p = list_entry(init_task.tasks.next, struct task_struct, tasks);
printk("%20s %20s/n" , "vm_area_start" , "vm_area_end" );
for (first = p->mm->mmap; first != NULL;){
printk("%20lx %20lx/n" , first->vm_start, first->vm_end);
first = first->vm->next;
}
return 0;
}
static int __init myproc_init(void ){
struct proc_dir_entry * e = create_proc_read_entry("myproc" ,0,NULL,read_myproc,NULL);
e->read_proc = read_myproc;
return 0;
}
static void __exit myproc_exit(void ){
removre_proc_entry("myproc" ,NULL);
}
module_init(myproc_init);
module_exit(myproc_exit);
MODULE_LICENSE("GPL" );
MODULE_AUTHOR("liwanpeng" );

檢視init程序的地址空間效果如下：

通過上面的理解我們可以看出程序就是通過mm_struct 來描述3G的線性地址空間，mm_struct通過

劃分為一個個線性區,而每個線性區用一個 vm_area_struct來描述，其實我們的mm_struct是與我們的可執行檔案的結構體相關聯的,首先看我們的mm_struct:

從上面可以看出mm_struct 包含了程序start_code,end_code,start_data,end_data等section段描述的結構,我們來看一個可執行檔案的構成來看看,就拿上面的hello

[[email protected] test]$ objdump -h hello

hello:     file format elf32-i386

Sections:
Idx Name          Size      VMA       LMA       File off Algn
0 .interp       00000013 08048134 08048134 00000134 2**0     VMA代表虛擬地址,這裡表示我們的程式執行是的虛擬地址起為

                                                                                                                        0x08048134
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
1 .note.ABI-tag 00000020 08048148 08048148 00000148 2**2
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
......
10 .init         00000030 080482f4 080482f4 000002f4 2**2          init載入頭最開始執行的
                  CONTENTS, ALLOC, LOAD, READONLY, CODE
11 .plt          00000070 08048324 08048324 00000324 2**2       跳轉我們程式執行的頭
                  CONTENTS, ALLOC, LOAD, READONLY, CODE
12 .text         000001cc 080483a0 080483a0 000003a0 2**4   ..即我們的程式碼段
                  CONTENTS, ALLOC, LOAD, READONLY, CODE
13 .fini         0000001c 0804856c 0804856c 0000056c 2**2
                  CONTENTS, ALLOC, LOAD, READONLY, CODE
14 .rodata       00000018 08048588 08048588 00000588 2**2
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
....
20 .dynamic      000000c8 08049654 08049654 00000654 2**2
                  CONTENTS, ALLOC, LOAD, DATA
21 .got          00000004 0804971c 0804971c 0000071c 2**2
                  CONTENTS, ALLOC, LOAD, DATA
....
23 .data         00000004 08049744 08049744 00000744 2**2            資料段
                  CONTENTS, ALLOC, LOAD, DATA
24 .bss          00000008 08049748 08049748 00000748 2**2         未初始化段
                  ALLOC
25 .comment      0000002c 00000000 00000000 00000748 2**0    未初始化的符號表
                  CONTENTS, READONLY

由連結過程可以看出main並不是真正的入口,是從.plt段中跳轉過來的所有的程式都是從這裡進入的，有一相當於jmp *main的跳轉指令,

同時可以看出我們的可執行檔案被分成以一個不同的section,這就和我們mm_struct中的線性區描述符對應起來了,比如我們的.data段就被載入到start_data與end_data地址空間的地方,其它的段與此類似！！！！！！,

那麼為什麼我們產生segment fault 呢，？？？因為我們訪問的地址沒有對映啊,!!!就是地址沒有在mm_struct中描述的空間中,因為我們的

mm_struct並沒有對映整個3G的空間啊,因為我們程式的每個段都是有大小限制的,.data,.text,.bss,.common等已經指名的section以外,

還有兩個非常重要的線性區start_stack,end_stack(棧)與start_brk,end_brk(堆)，如果我們訪問的線性地址沒有在這些地址空間中，那麼就會產生segment fault,

接下來我們檢視到底我們訪問的地址到底有沒有落在程序的mm_struct所描述的地址空間中:

[[email protected] test]$ ./hello 先開一個終端執行程式執行程式由於設定了100s的延時,
pid:32549
0x9848008

[[email protected] /]# cat /proc/32549/maps     檢視我們相應程序的資訊
0041d000-0043a000 r-xp 00000000 fd:00 278736     /lib/ld-2.13.so   //這裡是載入器
0043a000-0043b000 r--p 0001c000 fd:00 278736     /lib/ld-2.13.so
0043b000-0043c000 rw-p 0001d000 fd:00 278736     /lib/ld-2.13.so
0043e000-005c1000 r-xp 00000000 fd:00 278737     /lib/libc-2.13.so   //這裡是我們包含的庫函式相應的可執行檔案
005c1000-005c2000 ---p 00183000 fd:00 278737     /lib/libc-2.13.so
005c2000-005c4000 r--p 00183000 fd:00 278737     /lib/libc-2.13.so
005c4000-005c5000 rw-p 00185000 fd:00 278737     /lib/libc-2.13.so
005c5000-005c8000 rw-p 00000000 00:00 0
007b0000-007b1000 r-xp 00000000 00:00 0          [vdso]
08048000-08049000 r-xp 00000000 fd:00 1188391    /home/qiqi/test/hello   //這裡才是我們寫的程式碼段，r-xp代表只讀的
08049000-0804a000 rw-p 00000000 fd:00 1188391    /home/qiqi/test/hello // rw-p 表示可讀寫，為.data段
09848000-09869000 rw-p 00000000 00:00 0          [heap]                               //表示我們的堆預設的空間,當不足時在系統自動分配
b7856000-b7857000 rw-p 00000000 00:00 0
b7871000-b7873000 rw-p 00000000 00:00 0
bfa45000-bfa66000 rw-p 00000000 00:00 0          [stack]                                  //這裡是棧的預設空間
[[email protected] /]#

可以看出0x847e008沒有落在我們上面的任何一個線性區！！！！

待續！！！！！！

segment fault 段錯誤 (core dumped)的起因分析！

segment fault 段錯誤 (core dumped)的起因分析！

Linux下如何生成core dump 文件（解決segment fault段錯誤的問題）

PHP請求https域名發生segment fault段錯誤

Segmentation Fault 段錯誤的原因分析

關於Segmentation fault(段錯誤)探究

NoiLinux中編寫cpp程式出現段錯誤的解決方案分析

GDB arm-linux交叉編譯移植和使用方法（特別是對於正在執行的程式或者段錯誤的程式進行分析）

Segmentation fault段錯誤除錯總結

GDB遠端除錯（二）之用gdb解決segmentation-fault段錯誤，看gdb的使用（嵌入式）

造成segment fault，產生core dump的可能原因!

Linux Segmentation Fault 段錯誤產生原因除錯方法

造成segment fault，產生core dump的可能原因

【Z】段錯誤Segment Fault定位，即core dump文件與gdb定位

捕獲Linux段錯誤(Segment fault)並且列印錯誤堆疊

嵌入式使用gdb除錯段錯誤（segment fault）

linux之Segment Fault錯誤分析[2]

使用gdb除錯段錯誤（segment fault）

linux之Segment Fault錯誤分析[1]

GDB除錯php擴充套件錯誤(Segmentation fault (core dumped))

段錯誤(sgementation fault)和核心已轉儲(core dump)的除錯方法

segment fault 段錯誤 (core dumped)的起因分析！

相關推薦