【已解決】Linux下出現Segmentation Fault(core dump)錯誤
今天被這個問題搞了半個小時,後來通過新增printf(...)語句的方法找到了錯誤原因,是因為在程式中錯誤的輸出一個為空的字串導致。。。
1. 段錯誤是什麼
一句話來說,段錯誤是指訪問的記憶體超出了系統給這個程式所設定的記憶體空間,例如訪問了不存在的記憶體地址、訪問了系統保護的記憶體地址、訪問了只讀的記憶體地址等等情況。這裡貼一個對於“段錯誤”的準確定義(參考Answers.com):
A segmentation fault (often shortened to segfault) is a particular error condition that can occur during the operation of computer software. In short, a segmentation fault occurs whena program attempts to access a memory location that it is not allowed to access, or attempts to access a memory location in a way that is not allowed (e.g., attempts to write to a read-only location, or to overwrite part of the operating system). Systems based on processors like the Motorola 68000 tend to refer to these events as Address or Bus errors. Segmentation is one approach to memory management and protection in the operating system. It has been superseded by paging formost purposes, but much of the terminology of segmentation is still used, "segmentation fault" being an example. Some operating systems still have segmentation at some logical level although paging is used as the main memory management policy. On Unix-like operating systems, a process that accesses invalid memory receives the SIGSEGV signal. OnMicrosoft Windows, a process that accesses invalid memory receives the STATUS_ACCESS_VIOLATION exception.
2. 段錯誤產生的原因
2.1 訪問不存在的記憶體地址
#include<stdio.h> #include<stdlib.h> void main() { int *ptr = NULL; *ptr = 0; }
2.2 訪問系統保護的記憶體地址
#include<stdio.h> #include<stdlib.h> void main() { int *ptr = (int *)0; *ptr = 100; }
2.3 訪問只讀的記憶體地址
#include<stdio.h> #include<stdlib.h> #include<string.h> void main() { char *ptr = "test"; strcpy(ptr, "TEST"); }
2.4 棧溢位
#include<stdio.h>
#include<stdlib.h>
void main()
{
main();
}
等等其他原因。
3. 段錯誤資訊的獲取
程式發生段錯誤時,提示資訊很少,下面有幾種檢視段錯誤的發生資訊的途徑。
3.1 dmesg
dmesg可以在應用程式crash掉時,顯示核心中儲存的相關資訊。如下所示,通過dmesg命令可以檢視發生段錯誤的程式名稱、引起段錯誤發生的記憶體地址、指令指標地址、堆疊指標地址、錯誤程式碼、錯誤原因等。以程式2.3為例:
[email protected]:~/segfault$ dmesg [ 2329.479037] segfault3[2700]: segfault at 80484e0 ip 00d2906a sp bfbbec3c error 7 in libc-2.10.1.so[cb4000+13e000]
3.2 -g
使用gcc編譯程式的原始碼時,加上-g引數,這樣可以使得生成的二進位制檔案中加入可以用於gdb除錯的有用資訊。以程式2.3為例:
[email protected]:~/segfault$ gcc -g -o segfault3 segfault3.c
3.3 nm
使用nm命令列出二進位制檔案中的符號表,包括符號地址、符號型別、符號名等,這樣可以幫助定位在哪裡發生了段錯誤。以程式2.3為例:
[email protected]:~/segfault$ nm segfault3 08049f20 d _DYNAMIC 08049ff4 d _GLOBAL_OFFSET_TABLE_ 080484dc R _IO_stdin_used w _Jv_RegisterClasses 08049f10 d __CTOR_END__ 08049f0c d __CTOR_LIST__ 08049f18 D __DTOR_END__ 08049f14 d __DTOR_LIST__ 080484ec r __FRAME_END__ 08049f1c d __JCR_END__ 08049f1c d __JCR_LIST__ 0804a014 A __bss_start 0804a00c D __data_start 08048490 t __do_global_ctors_aux 08048360 t __do_global_dtors_aux 0804a010 D __dso_handle w __gmon_start__ 0804848a T __i686.get_pc_thunk.bx 08049f0c d __init_array_end 08049f0c d __init_array_start 08048420 T __libc_csu_fini 08048430 T __libc_csu_init U [email protected]@GLIBC_2.0 0804a014 A _edata 0804a01c A _end 080484bc T _fini 080484d8 R _fp_hw 080482bc T _init 08048330 T _start 0804a014 b completed.6990 0804a00c W data_start 0804a018 b dtor_idx.6992 080483c0 t frame_dummy 080483e4 T main U [email protected]@GLIBC_2.0
3.4 ldd
使用ldd命令檢視二進位制程式的共享連結庫依賴,包括庫的名稱、起始地址,這樣可以確定段錯誤到底是發生在了自己的程式中還是依賴的共享庫中。以程式2.3為例:
[email protected]:~/segfault$ ldd ./segfault3 linux-gate.so.1 => (0x00e08000) libc.so.6 => /lib/tls/i686/cmov/libc.so.6 (0x00675000) /lib/ld-linux.so.2 (0x00482000)
4. 段錯誤的除錯方法
4.1 使用printf輸出資訊
這個是看似最簡單但往往很多情況下十分有效的除錯方式,也許可以說是程式設計師用的最多的除錯方式。簡單來說,就是在程式的重要程式碼附近加上像printf這類輸出資訊,這樣可以跟蹤並打印出段錯誤在程式碼中可能出現的位置。
為了方便使用這種方法,可以使用條件編譯指令#ifdef DEBUG和#endif把printf函式包起來。這樣在程式編譯時,如果加上-DDEBUG引數就能檢視除錯資訊;否則不加該引數就不會顯示除錯資訊。
4.2 使用gcc和gdb
4.2.1 除錯步驟
1、為了能夠使用gdb除錯程式,在編譯階段加上-g引數,以程式2.3為例:
[email protected]:~/segfault$ gcc -g -o segfault3 segfault3.c
2、使用gdb命令除錯程式:
[email protected]:~/segfault$ gdb ./segfault3 GNU gdb (GDB) 7.0-ubuntu Copyright (C) 2009 Free Software Foundation, Inc. License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html> This is free software: you are free to change and redistribute it. There is NO WARRANTY, to the extent permitted by law. Type "show copying" and "show warranty" for details. This GDB was configured as "i486-linux-gnu". For bug reporting instructions, please see: <http://www.gnu.org/software/gdb/bugs/>... Reading symbols from /home/panfeng/segfault/segfault3...done. (gdb)
3、進入gdb後,執行程式:
(gdb) run
Starting program: /home/panfeng/segfault/segfault3
Program received signal SIGSEGV, Segmentation fault.
0x001a306a in memcpy () from /lib/tls/i686/cmov/libc.so.6
(gdb)
從輸出看出,程式2.3收到SIGSEGV訊號,觸發段錯誤,並提示地址0x001a306a、呼叫memcpy報的錯,位於/lib/tls/i686/cmov/libc.so.6庫中。
4、完成除錯後,輸入quit命令退出gdb:
(gdb) quit A debugging session is active. Inferior 1 [process 3207] will be killed. Quit anyway? (y or n) y
4.2.2 適用場景
1、僅當能確定程式一定會發生段錯誤的情況下使用。
2、當程式的原始碼可以獲得的情況下,使用-g引數編譯程式。
3、一般用於測試階段,生產環境下gdb會有副作用:使程式執行減慢,執行不夠穩定,等等。
4、即使在測試階段,如果程式過於複雜,gdb也不能處理。
4.3 使用core檔案和gdb
在4.2節中提到段錯誤會觸發SIGSEGV訊號,通過man 7 signal,可以看到SIGSEGV預設的handler會列印段錯誤出錯資訊,併產生core檔案,由此我們可以藉助於程式異常退出時生成的core檔案中的除錯資訊,使用gdb工具來除錯程式中的段錯誤。
4.3.1 除錯步驟
1、在一些Linux版本下,預設是不產生core檔案的,首先可以檢視一下系統core檔案的大小限制:
[email protected]:~/segfault$ ulimit -c 0
2、可以看到預設設定情況下,本機Linux環境下發生段錯誤時不會自動生成core檔案,下面設定下core檔案的大小限制(單位為KB):
[email protected]:~/segfault$ ulimit -c 1024 [email protected]:~/segfault$ ulimit -c 1024
3、執行程式2.3,發生段錯誤生成core檔案:
[email protected]:~/segfault$ ./segfault3 段錯誤 (core dumped)
4、載入core檔案,使用gdb工具進行除錯:
[email protected]:~/segfault$ gdb ./segfault3 ./core GNU gdb (GDB) 7.0-ubuntu Copyright (C) 2009 Free Software Foundation, Inc. License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html> This is free software: you are free to change and redistribute it. There is NO WARRANTY, to the extent permitted by law. Type "show copying" and "show warranty" for details. This GDB was configured as "i486-linux-gnu". For bug reporting instructions, please see: <http://www.gnu.org/software/gdb/bugs/>... Reading symbols from /home/panfeng/segfault/segfault3...done. warning: Can't read pathname for load map: 輸入/輸出錯誤. Reading symbols from /lib/tls/i686/cmov/libc.so.6...(no debugging symbols found)...done. Loaded symbols for /lib/tls/i686/cmov/libc.so.6 Reading symbols from /lib/ld-linux.so.2...(no debugging symbols found)...done. Loaded symbols for /lib/ld-linux.so.2 Core was generated by `./segfault3'. Program terminated with signal 11, Segmentation fault. #0 0x0018506a in memcpy () from /lib/tls/i686/cmov/libc.6
從輸出看出,同4.2.1中一樣的段錯誤資訊。
5、完成除錯後,輸入quit命令退出gdb:
(gdb) quit
4.3.2 適用場景
1、適合於在實際生成環境下除錯程式的段錯誤(即在不用重新發生段錯誤的情況下重現段錯誤)。
2、當程式很複雜,core檔案相當大時,該方法不可用。
4.4 使用objdump
4.4.1 除錯步驟
1、使用dmesg命令,找到最近發生的段錯誤輸出資訊:
[email protected]:~/segfault$ dmesg ... ... [17257.502808] segfault3[3320]: segfault at 80484e0 ip 0018506a sp bfc1cd6c error 7 in libc-2.10.1.so[110000+13e000]
其中,對我們接下來的除錯過程有用的是發生段錯誤的地址:80484e0和指令指標地址:0018506a。
2、使用objdump生成二進位制的相關資訊,重定向到檔案中:
[email protected]:~/segfault$ objdump -d ./segfault3 > segfault3Dump
其中,生成的segfault3Dump檔案中包含了二進位制檔案的segfault3的彙編程式碼。
3、在segfault3Dump檔案中查詢發生段錯誤的地址:
[email protected]:~/segfault$ grep -n -A 10 -B 10 "80484e0" ./segfault3Dump 121- 80483df: ff d0 call *%eax 122- 80483e1: c9 leave 123- 80483e2: c3 ret 124- 80483e3: 90 nop 125- 126-080483e4 <main>: 127- 80483e4: 55 push %ebp 128- 80483e5: 89 e5 mov %esp,%ebp 129- 80483e7: 83 e4 f0 and $0xfffffff0,%esp 130- 80483ea: 83 ec 20 sub $0x20,%esp 131: 80483ed: c7 44 24 1c e0 84 04 movl $0x80484e0,0x1c(%esp) 132- 80483f4: 08 133- 80483f5: b8 e5 84 04 08 mov $0x80484e5,%eax 134- 80483fa: c7 44 24 08 05 00 00 movl $0x5,0x8(%esp) 135- 8048401: 00 136- 8048402: 89 44 24 04 mov %eax,0x4(%esp) 137- 8048406: 8b 44 24 1c mov 0x1c(%esp),%eax 138- 804840a: 89 04 24 mov %eax,(%esp) 139- 804840d: e8 0a ff ff ff call 804831c <[email protected]> 140- 8048412: c9 leave 141- 8048413: c3 ret
通過對以上彙編程式碼分析,得知段錯誤發生main函式,對應的彙編指令是movl $0x80484e0,0x1c(%esp),接下來開啟程式的原始碼,找到彙編指令對應的原始碼,也就定位到段錯誤了。
4.4.2 適用場景
1、不需要-g引數編譯,不需要藉助於core檔案,但需要有一定的組合語言基礎。
2、如果使用了gcc編譯優化引數(-O1,-O2,-O3)的話,生成的彙編指令將會被優化,使得除錯過程有些難度。
4.5 使用catchsegv
catchsegv命令專門用來撲獲段錯誤,它通過動態載入器(ld-linux.so)的預載入機制(PRELOAD)把一個事先寫好的庫(/lib/libSegFault.so)載入上,用於捕捉斷錯誤的出錯資訊。
[email protected]:~/segfault$ catchsegv ./segfault3 Segmentation fault (core dumped) *** Segmentation fault Register dump: EAX: 00000000 EBX: 00fb3ff4 ECX: 00000002 EDX: 00000000 ESI: 080484e5 EDI: 080484e0 EBP: bfb7ad38 ESP: bfb7ad0c EIP: 00ee806a EFLAGS: 00010203 CS: 0073 DS: 007b ES: 007b FS: 0000 GS: 0033 SS: 007b Trap: 0000000e Error: 00000007 OldMask: 00000000 ESP/signal: bfb7ad0c CR2: 080484e0 Backtrace: /lib/libSegFault.so[0x3b606f] ??:0(??)[0xc76400] /lib/tls/i686/cmov/libc.so.6(__libc_start_main+0xe6)[0xe89b56] /build/buildd/eglibc-2.10.1/csu/../sysdeps/i386/elf/start.S:122(_start)[0x8048351] Memory map: 00258000-00273000 r-xp 00000000 08:01 157 /lib/ld-2.10.1.so 00273000-00274000 r--p 0001a000 08:01 157 /lib/ld-2.10.1.so 00274000-00275000 rw-p 0001b000 08:01 157 /lib/ld-2.10.1.so 003b4000-003b7000 r-xp 00000000 08:01 13105 /lib/libSegFault.so 003b7000-003b8000 r--p 00002000 08:01 13105 /lib/libSegFault.so 003b8000-003b9000 rw-p 00003000 08:01 13105 /lib/libSegFault.so 00c76000-00c77000 r-xp 00000000 00:00 0 [vdso] 00e0d000-00e29000 r-xp 00000000 08:01 4817 /lib/libgcc_s.so.1 00e29000-00e2a000 r--p 0001b000 08:01 4817 /lib/libgcc_s.so.1 00e2a000-00e2b000 rw-p 0001c000 08:01 4817 /lib/libgcc_s.so.1 00e73000-00fb1000 r-xp 00000000 08:01 1800 /lib/tls/i686/cmov/libc-2.10.1.so 00fb1000-00fb2000 ---p 0013e000 08:01 1800 /lib/tls/i686/cmov/libc-2.10.1.so 00fb2000-00fb4000 r--p 0013e000 08:01 1800 /lib/tls/i686/cmov/libc-2.10.1.so 00fb4000-00fb5000 rw-p 00140000 08:01 1800 /lib/tls/i686/cmov/libc-2.10.1.so 00fb5000-00fb8000 rw-p 00000000 00:00 0 08048000-08049000 r-xp 00000000 08:01 303895 /home/panfeng/segfault/segfault3 08049000-0804a000 r--p 00000000 08:01 303895 /home/panfeng/segfault/segfault3 0804a000-0804b000 rw-p 00001000 08:01 303895 /home/panfeng/segfault/segfault3 09432000-09457000 rw-p 00000000 00:00 0 [heap] b78cf000-b78d1000 rw-p 00000000 00:00 0 b78df000-b78e1000 rw-p 00000000 00:00 0 bfb67000-bfb7c000 rw-p 00000000 00:00 0 [stack]
5. 一些注意事項
1、出現段錯誤時,首先應該想到段錯誤的定義,從它出發考慮引發錯誤的原因。
2、在使用指標時,定義了指標後記得初始化指標,在使用的時候記得判斷是否為NULL。
3、在使用陣列時,注意陣列是否被初始化,陣列下標是否越界,陣列元素是否存在等。
4、在訪問變數時,注意變數所佔地址空間是否已經被程式釋放掉。
5、在處理變數時,注意變數的格式控制是否合理等。
6. 參考資料列表
1、http://www.docin.com/p-105923877.html
2、http://blog.chinaunix.net/space.php?uid=317451&do=blog&id=92412
相關推薦
[轉]【已解決】Linux下出現Segmentation Fault(core dump)錯誤
最近在Linux環境下做C語言專案,由於是在一個原有專案基礎之上進行二次開發,而且專案工程龐大複雜,出現了不少問題,其中遇到最多、花費時間最長的問題就是著名的“段錯誤”(Segmentation Fault)。藉此機會系統學習了一下,這裡對Linux環境下的
【已解決】Linux下出現Segmentation Fault(core dump)錯誤
今天被這個問題搞了半個小時,後來通過新增printf(...)語句的方法找到了錯誤原因,是因為在程式中錯誤的輸出一個為空的字串導致。。。 1. 段錯誤是什麼 一句話來說,段錯誤是指訪問的記憶體超出了系統給這個程式所設定的記憶體空間,例如訪問了不存在的記憶體地址、訪
【已解決】匯入tensorflow出現ImportError
原先在Ubuntu16.04下執行的tensorflow是1.1版的,今天將Python升級為3.6.5版,用Anaconda安裝了tensorflow1.4.1,安裝沒有出現問題提示,在匯入tensorflow時出現: ImportError: /home/ctr/ana
【已解決】linux redhat 6 如何開啟防火牆中的某個埠?例如:5900埠
vim /etc/sysconfig/iptables 開啟此檔案新增一下命令,之前要確認,沒有把所有的埠都關閉了,iptables載入命令是有順序的,先載入前面的命令,所以以下命令一定要在全部禁止的命令前面-A INPUT -m state --state
【已解決】BaseMultiItemQuickAdapter使用出現NotFoundException: Resource ID #0xfffffe6c
看過很多帖子說的都比較含糊,在此記錄一下: 問題就在於實體類重寫的getItemType()方法返回值的個數要等於介面卡構造中addItemType的個數,下面貼上我的程式碼: public NewsAdapter(List<NewsListBean.ItemBean>
【已解決】PyCharm中出現unresolved reference error
問題描述 從GitHub上克隆的Python專案,在本地使用PyCharm開啟,發現在某個檔案的頭部匯入模組的部分報錯Unresolved reference 'pytools',出錯的程式碼如下所示 from pytools.model import
【已解決】linux修改資料夾的所屬使用者組
[xxx@xxxx www]$ ll -a total 36 drwxr-xr-x. 9 root root 4096 Aug 26 23:23 . drwxr-xr-x. 24 root root
Windows下使用csv.writer寫檔案出現空行【已解決】
在學習pytorch教程中Chatbot Tutorial,跟著作者的程式碼復現,遇到了這個問題:在把格式化的對話資料寫入檔案時,發現多了空行,作者的程式碼是: # Write new csv file print("\nWriting newly formatted file...")
lnmp 搭建後,nginx下php文件404但是html文件正常訪問【已解決】
() stack 找到 span nec mis group php 方法 今天遇到 了如題的問題。 上網查了很多資料 最終是在這個鏈接 裏 找到了能解決我的問題的方法 https://stackoverflow.com/questions/23443398/nginx-e
Python + Appium 【已解決】driver(session)在多個class之間復用,執行完一個類的用例,再次執行下個類的用例時不需要初始化
nic bject config com appium client lee session ted py文件的名稱為:appium_config.py 中的寫法如下 # coding=UTF-8 ‘‘‘ Created on 2017.1.13 @author: Lu
【已解決】在 Visual Studio 中設置 JavaScript/TypeScript 的斷點 腳本出現自動中斷錯誤
chrome alt 啟動應用 出現 ont ash 解決方法 腳本調試 設置 運行ASP.NET Core 程序出現錯誤如下: 已啟用 Visual Studio 中的 Chrome 腳本調試 在 Visual Studio 中設置 JavaScript/Type
【已解決】checkout 配置無效的問題可以進來看下
開始 以及 com git pan 項目 遇到 轉載 沖突 在日常工作中,我們經常會遇到要更新一個項目,但是由於更改了配置,需要將這些配置commit或者checkout,但是有的同學不想commit怎麽辦呢,只能通過checkout,那麽問題又來了,改了很多配置,chec
【已解決】本地使用者和組出現錯誤:庫沒有註冊
環境 Windows7 64位系統 發現問題 開啟計算機管理,本地使用者和組出現錯誤,提示錯誤原因“庫沒有註冊”,如下圖。 解決問題 說明:方法來源於網路,侵刪歉。 建立文字檔案,寫入如下內容: Windows R
【已解決】如何做excel表的下拉框多選
最近因為專案需求,要製作一個excel匯入的模板,模板中要求某幾列的下拉框是多選的。。不得不臨時研究了一下vba。其間各種心酸不多說。。。。。。 首先,這個是需要啟用巨集,在vb編輯器裡寫程式碼,所以你要確保你的excel是可以啟用巨集的。如果是正式版的office是可以直接用(破解版就不知道了
【已解決】maven環境下log4j配置檔案無效的解決方案
背景:學webmagic時跑官方案例,出現以下錯誤: log4j:WARN No appenders could be found for logger (us.codecraft.webmagic.scheduler.QueueScheduler). log4j:WARN
【已解決】APP啟動時,總是出現一個空白頁
APP啟動時,總是出現一個空白頁,簡單說:閃屏。 導致原因(AndroidManifest檔案): <application android:allowBackup="true" android:icon="@mipmap/logo"
【已解決】iphone 登出賬號的時候報錯:驗證失敗,連線到伺服器時出現問題
iphone 登出賬號的時候報錯:驗證失敗,連線到伺服器時出現問題,如下 在網上查了半天一點都沒有用 最後撥打的蘋果熱線,原來是蘋果的網路許可權的問題,預設的是把“設定”應用的網路關閉的,只需要把網路裡面“設定”這個應用的網路允許“WLAN與蜂窩行動網路”。 第
【已解決】SpringMVC表單提交結果頁面出現400錯誤的可能原因分析
頁面錯誤: The server cannot or will not process the request due to something that is perceived to be a client error (e.g., malformed reques
【已解決】VMware Linux虛擬機器執行提示“鎖定檔案失敗,虛擬機器開啟模組snapshot失敗”的解決辦法
原因:本人因在設定虛擬機器時CD/DVD硬體連線方式將使用iso映像檔案改成了物理驅動連線,導致VMware Linux虛擬機器啟動時提示“鎖定檔案失敗...” 、 (注:期間碰到程序被佔用問題
【已解決】VMWare執行虛擬機器出現內部錯誤
因為想要自制一份ubuntu系統映象,擔心因為自己的錯誤操作而破壞了原系統,所以打算在VMware下建立ubuntu虛擬機器,並在虛擬機器內執行拷貝。(這是一個很好的辦法,也是虛擬機器存在的意義吧) 第一天晚上建立好虛擬機器後,便關機了。今天早上再