1. 程式人生 > >linux下追蹤函式呼叫堆疊backtrace

linux下追蹤函式呼叫堆疊backtrace

程式在得到一個Segmentation fault這樣的錯誤資訊毫無保留地就跳出來了,遇到這樣的問題讓人很痛苦,查詢問題不亞於你N多天辛苦勞累編寫程式碼的難度。那麼有沒有更好的方法可以在產生SIGSEGV訊號的時候得到除錯可用的資訊呢?看看下面的例程吧!

sigsegv.h

#ifndef __sigsegv_h__
#define __sigsegv_h__

#ifdef __cplusplus
extern "C" {
#endif

  int setup_sigsegv();

#ifdef __cplusplus
}
#endif

#endif /* __sigsegv_h__ */

sigsegv.c
#define _GNU_SOURCE
#include <memory.h>
#include <stdlib.h>
#include <stdio.h>
#include <signal.h>
#include <ucontext.h>
#include <dlfcn.h>
#include <execinfo.h>
#ifndef NO_CPP_DEMANGLE
#include <cxxabi.h>
#endif

#if defined(REG_RIP)
# define SIGSEGV_STACK_IA64
# define REGFORMAT "%016lx"
#elif defined(REG_EIP)
# define SIGSEGV_STACK_X86
# define REGFORMAT "%08x"
#else
# define SIGSEGV_STACK_GENERIC
# define REGFORMAT "%x"
#endif

static void signal_segv(int signum, siginfo_t* info, void*ptr) {
  static const char *si_codes[3] = {"", "SEGV_MAPERR", "SEGV_ACCERR"};

  size_t i;
  ucontext_t *ucontext = (ucontext_t*)ptr;

#if defined(SIGSEGV_STACK_X86) || defined(SIGSEGV_STACK_IA64)
  int f = 0;
  Dl_info dlinfo;
  void **bp = 0;
  void *ip = 0;
#else
  void *bt[20];
  char **strings;
  size_t sz;
#endif

  fprintf(stderr, "Segmentation Fault!/n");
  fprintf(stderr, "info.si_signo = %d/n", signum);
  fprintf(stderr, "info.si_errno = %d/n", info->si_errno);
  fprintf(stderr, "info.si_code  = %d (%s)/n", info->si_code, si_codes[info->si_code]);
  fprintf(stderr, "info.si_addr  = %p/n", info->si_addr);
  for(i = 0; i < NGREG; i++)
    fprintf(stderr, "reg[%02d]       = 0x" REGFORMAT "/n", i, ucontext->uc_mcontext.gregs[i]);

#if defined(SIGSEGV_STACK_X86) || defined(SIGSEGV_STACK_IA64)
# if defined(SIGSEGV_STACK_IA64)
  ip = (void*)ucontext->uc_mcontext.gregs[REG_RIP];
  bp = (void**)ucontext->uc_mcontext.gregs[REG_RBP];
# elif defined(SIGSEGV_STACK_X86)
  ip = (void*)ucontext->uc_mcontext.gregs[REG_EIP];
  bp = (void**)ucontext->uc_mcontext.gregs[REG_EBP];
# endif

  fprintf(stderr, "Stack trace:/n");
  while(bp && ip) {
    if(!dladdr(ip, &dlinfo))
      break;

    const char *symname = dlinfo.dli_sname;
#ifndef NO_CPP_DEMANGLE
    int status;
    char *tmp = __cxa_demangle(symname, NULL, 0, &status);

    if(status == 0 && tmp)
      symname = tmp;
#endif

    fprintf(stderr, "% 2d: %p <%s+%u> (%s)/n",
            ++f,
            ip,
            symname,
            (unsigned)(ip - dlinfo.dli_saddr),
            dlinfo.dli_fname);

#ifndef NO_CPP_DEMANGLE
    if(tmp)
      free(tmp);
#endif

    if(dlinfo.dli_sname && !strcmp(dlinfo.dli_sname, "main"))
      break;

    ip = bp[1];
    bp = (void**)bp[0];
  }
#else
  fprintf(stderr, "Stack trace (non-dedicated):/n");
  sz = backtrace(bt, 20);
  strings = backtrace_symbols(bt, sz);

  for(i = 0; i < sz; ++i)
    fprintf(stderr, "%s/n", strings[i]);
#endif
  fprintf(stderr, "End of stack trace/n");
  exit (-1);
}

int setup_sigsegv() {
  struct sigaction action;
  memset(&action, 0, sizeof(action));
  action.sa_sigaction = signal_segv;
  action.sa_flags = SA_SIGINFO;
  if(sigaction(SIGSEGV, &action, NULL) < 0) {
    perror("sigaction");
    return 0;
  }

  return 1;
}

#ifndef SIGSEGV_NO_AUTO_INIT
static void __attribute((constructor)) init(void) {
  setup_sigsegv();
}
#endif
 
main.c
#include "sigsegv.h"
#include <string.h>

int die() {
  char *err = NULL;
  strcpy(err, "gonner");
  return 0;
}

int main() {
  return die();
}


下面來編譯上面的main.c程式看看將會產生什麼樣的資訊呢,不過要注意的就是如果要在你的程式裡引用sigsegv.h、sigsegv.c得到堆疊資訊的話記得加上-rdynamic -ldl引數。

/data/codes/c/test/backtraces $ gcc -o test -rdynamic -ldl -ggdb -g sigsegv.c main.c
/data/codes/c/test/backtraces $ ./test
Segmentation Fault!
info.si_signo = 11
info.si_errno = 0
info.si_code  = 1 (SEGV_MAPERR)
info.si_addr  = (nil)
reg[00]       = 0x00000033
reg[01]       = 0x00000000
reg[02]       = 0xc010007b
reg[03]       = 0x0000007b
reg[04]       = 0x00000000
reg[05]       = 0xb7fc8ca0
reg[06]       = 0xbff04c2c
reg[07]       = 0xbff04c1c
reg[08]       = 0xb7f8cff4
reg[09]       = 0x00000001
reg[10]       = 0xbff04c50
reg[11]       = 0x00000000
reg[12]       = 0x0000000e
reg[13]       = 0x00000006
reg[14]       = 0x080489ec
reg[15]       = 0x00000073
reg[16]       = 0x00010282
reg[17]       = 0xbff04c1c
reg[18]       = 0x0000007b
Stack trace:
 1: 0x80489ec &lt;die+16&gt; (/data/codes/c/test/backtraces/test)
 2: 0x8048a16 &lt;main+19&gt; (/data/codes/c/test/backtraces/test)
End of stack trace
/data/codes/c/test/backtraces $

下面用gdb來看看出錯的地方左右的程式碼:

/data/codes/c/test/backtraces $ gdb ./test
gdb&gt; disassemble die+16
Dump of assembler code for function die:
0x080489dc &lt;die+0&gt;:     push   %ebp
0x080489dd &lt;die+1&gt;:     mov    %esp,%ebp
0x080489df &lt;die+3&gt;:     sub    $0x10,%esp
0x080489e2 &lt;die+6&gt;:     movl   $0x0,0xfffffffc(%ebp)
0x080489e9 &lt;die+13&gt;:    mov    0xfffffffc(%ebp),%eax
0x080489ec &lt;die+16&gt;:    movl   $0x6e6e6f67,(%eax)
0x080489f2 &lt;die+22&gt;:    movw   $0x7265,0x4(%eax)
0x080489f8 &lt;die+28&gt;:    movb   $0x0,0x6(%eax)
0x080489fc &lt;die+32&gt;:    mov    $0x0,%eax
0x08048a01 &lt;die+37&gt;:    leave  
0x08048a02 &lt;die+38&gt;:    ret    
End of assembler dump.
gdb&gt;

也可以直接break *die+16進行除錯,看看在出錯之前的堆疊情況,那麼下面我們再來看看程式碼問題到底出在什麼地方了。

/data/codes/c/test/backtraces $ gdb ./test
gdb&gt; break *die+16
Breakpoint 1 at 0x80489f2: file main.c, line 6.
gdb&gt; list *die+16
0x80489f2 is in die (main.c:6).
1       #include "sigsegv.h"
2       #include &lt;string.h&gt;
3       
4       int die() {
5         char *err = NULL;
6         strcpy(err, "gonner");
7         return 0;
8       }
9       
10      int main() {
gdb&gt;

現在看看定位錯誤將會多麼方便,上面的除錯指令中list之前break不是必須的,只是讓你可以看到break其實就已經指出了哪一行程式碼導致 Segmentation fault了。如果你要釋出你的程式你一般會為了減少體積不會附帶除錯資訊的(也就是不加-ggdb -g引數),不過沒關係,你一樣可以得到上面stack-trace資訊,然後你除錯之前只要加上除錯資訊即可。