Android下列印除錯堆疊方法
列印堆疊是除錯的常用方法,一般在系統異常時,我們可以將異常情況下的堆疊打印出來,這樣十分方便錯誤查詢。實際上還有另外一個非常有用的功能:分析程式碼的行為。android程式碼太過龐大複雜了,完全的靜態分析經常是無從下手,因此通過列印堆疊的動態分析也十分必要。
Android列印堆疊的方法,簡單歸類一下
1. zygote的堆疊dump
實際上這個可以同時dump java執行緒及native執行緒的堆疊,對於java執行緒,java堆疊和native堆疊都可以得到。
使用方法很簡單,直接在adb shell或串列埠中輸入:
[plain]
- kill -3 <pid>
如果需要在程式碼中,更容易控制堆疊的輸出時機,可以用以下命令獲取zygote的core dump:
[java]- Process.sendSignal(pid, Process.SIGNAL_QUIT);
原理和命令列是一樣的。
不過需要注意兩點:
- adb shell可能會沒有許可權,需要root。
- android 4.2中關閉了native thread的堆疊列印,詳見 dalvik/vm/Thread.cpp的dumpNativeThread方法:
- dvmPrintDebugMessage(target,
- "\"%s\" sysTid=%d nice=%d sched=%d/%d cgrp=%s\n",
- name, tid, getpriority(PRIO_PROCESS, tid),
- schedStats.policy, schedStats.priority, schedStats.group);
- dumpSchedStat(target, tid);
- // Temporarily disabled collecting native stacks from non-Dalvik
- // threads because sometimes they misbehave.
- //dvmDumpNativeStack(target, tid);
Native堆疊的列印被關掉了!不過對於大多數情況,可以直接將這個註釋開啟。
2. debuggerd的堆疊dump
debuggerd是android的一個daemon程序,負責在程序異常出錯時,將程序的執行時資訊dump出來供分析。debuggerd生成的coredump資料是以文字形式呈現,被儲存在 /data/tombstone/ 目錄下(名字取的也很形象,tombstone是墓碑的意思),共可儲存10個檔案,當超過10個時,會覆蓋重寫最早生成的檔案。從4.2版本開始,debuggerd同時也是一個實用工具:可以在不中斷程序執行的情況下列印當前程序的native堆疊。使用方法是:
[plain] view plain copy
- debuggerd -b <pid>
3. java程式碼中列印堆疊
Java程式碼列印堆疊比較簡單, 堆疊資訊獲取和輸出,都可以通過Throwable類的方法實現。目前通用的做法是在java程序出現需要注意的異常時,列印堆疊,然後再決定退出或挽救。通常的方法是使用exception的printStackTrace()方法:
[java] view plain copy
- try {
- ...
- } catch (RemoteException e) {
- e.printStackTrace();
- ...
- }
當然也可以只打印堆疊不退出,這樣就比較方便分析程式碼的動態執行情況。Java程式碼中插入堆疊列印的方法如下:
[java] view plain copy- Log.d(TAG,Log.getStackTraceString(new Throwable()));
4. C++程式碼中列印堆疊
C++也是支援異常處理的,異常處理庫中,已經包含了獲取backtrace的介面,Android也是利用這個介面來列印堆疊資訊的。在Android的C++中,已經集成了一個工具類CallStack,在libutils.so中。使用方法:
[cpp] view plain copy- #include <utils/CallStack.h>
- ...
- CallStack stack;
- stack.update();
- stack.dump();
使用方式比較簡單。目前Andoid4.2版本已經將相關資訊解析的很到位,符號表查詢,demangle,偏移位置校正都做好了。
[plain] view plain copy5. C程式碼中列印堆疊
C程式碼,尤其是底層C庫,想要看到呼叫的堆疊資訊,還是比較麻煩的。 CallStack肯定是不能用,一是因為其實C++寫的,需要重新封裝才能在C中使用,二是底層庫反調上層庫的函式,會造成連結器迴圈依賴而無法連結。不過也不是沒有辦法,可以通過android工具類CallStack實現中使用的unwind呼叫及符號解析函式來處理。
這裡需要注意的是,為解決連結問題,最好使用dlopen方式,查詢需要用到的介面再直接呼叫,這樣會比較簡單。如下為相關的實現程式碼,只需要在要列印的檔案中插入此部分程式碼,然後呼叫getCallStack()即可,無需包含太多的標頭檔案和修改Android.mk檔案:
[cpp] view plain copy- #define MAX_DEPTH 31
- #define MAX_BACKTRACE_LINE_LENGTH 800
- #define PATH "/system/lib/libcorkscrew.so"
- typedef ssize_t (*unwindFn)(backtrace_frame_t*, size_t, size_t);
- typedef void (*unwindSymbFn)(const backtrace_frame_t*, size_t, backtrace_symbol_t*);
- typedef void (*unwindSymbFreeFn)(backtrace_symbol_t*, size_t);
- static void *gHandle = NULL;
- static int getCallStack(void){
- ssize_t i = 0;
- ssize_t result = 0;
- ssize_t count;
- backtrace_frame_t mStack[MAX_DEPTH];
- backtrace_symbol_t symbols[MAX_DEPTH];
- unwindFn unwind_backtrace = NULL;
- unwindSymbFn get_backtrace_symbols = NULL;
- unwindSymbFreeFn free_backtrace_symbols = NULL;
- // open the so.
- if(gHandle == NULL) gHandle = dlopen(PATH, RTLD_NOW);
- // get the interface for unwind and symbol analyse
- if(gHandle != NULL) unwind_backtrace = (unwindFn)dlsym(gHandle, "unwind_backtrace");
- if(gHandle != NULL) get_backtrace_symbols = (unwindSymbFn)dlsym(gHandle, "get_backtrace_symbols");
- if(gHandle != NULL) free_backtrace_symbols = (unwindSymbFreeFn)dlsym(gHandle, "free_backtrace_symbols");
- if(!gHandle ||!unwind_backtrace ||!get_backtrace_symbols || !free_backtrace_symbols ){
- ALOGE("Error! cannot get unwind info: handle:%p %p %p %p",
- gHandle, unwind_backtrace, get_backtrace_symbols, free_backtrace_symbols );
- return result;
- }
- count= unwind_backtrace(mStack, 1, MAX_DEPTH);
- get_backtrace_symbols(mStack, count, symbols);
- for (i = 0; i < count; i++) {
- char line[MAX_BACKTRACE_LINE_LENGTH];
- const char* mapName = symbols[i].map_name ? symbols[i].map_name : "<unknown>";
- const char* symbolName =symbols[i].demangled_name ? symbols[i].demangled_name : symbols[i].symbol_name;
- size_t fieldWidth = (MAX_BACKTRACE_LINE_LENGTH - 80) / 2;
- if (symbolName) {
- uint32_t pc_offset = symbols[i].relative_pc - symbols[i].relative_symbol_addr;
- if (pc_offset) {
- snprintf(line, MAX_BACKTRACE_LINE_LENGTH, "#%02d pc %08x %.*s (%.*s+%u)",
- i, symbols[i].relative_pc, fieldWidth, mapName,
- fieldWidth, symbolName, pc_offset);
- } else {
- snprintf(line, MAX_BACKTRACE_LINE_LENGTH, "#%02d pc %08x %.*s (%.*s)",
- i, symbols[i].relative_pc, fieldWidth, mapName,
- fieldWidth, symbolName);
- }
- } else {
- snprintf(line, MAX_BACKTRACE_LINE_LENGTH, "#%02d pc %08x %.*s",
- i, symbols[i].relative_pc, fieldWidth, mapName);
- }
- ALOGD("%s", line);
- }
- free_backtrace_symbols(symbols, count);
- return result;
- }
對sched_policy.c的堆疊呼叫分析如下,注意具體是否要列印,在哪裡列印,還可以通過pid、uid、property等來控制一下,這樣就不會被淹死在trace的汪洋大海中。
[plain] view plain copy- D/SchedPolicy( 1350): #00 pc 0000676c /system/lib/libcutils.so
- D/SchedPolicy( 1350): #01 pc 00006b3a /system/lib/libcutils.so (set_sched_policy+49)
- D/SchedPolicy( 1350): #02 pc 00010e82 /system/lib/libutils.so (androidSetThreadPriority+61)
- D/SchedPolicy( 1350): #03 pc 00068104 /system/lib/libandroid_runtime.so (android_os_Process_setThreadPriority(_JNIEnv*, _jobject*, int, int)+7)
- D/SchedPolicy( 1350): #04 pc 0001e510 /system/lib/libdvm.so (dvmPlatformInvoke+112)
- D/SchedPolicy( 1350): #05 pc 0004d6aa /system/lib/libdvm.so (dvmCallJNIMethod(unsigned int const*, JValue*, Method const*, Thread*)+417)
- D/SchedPolicy( 1350): #06 pc 00027920 /system/lib/libdvm.so
- D/SchedPolicy( 1350): #07 pc 0002b7fc /system/lib/libdvm.so (dvmInterpret(Thread*, Method const*, JValue*)+184)
- D/SchedPolicy( 1350): #08 pc 00060c30 /system/lib/libdvm.so (dvmCallMethodV(Thread*, Method const*, Object*, bool, JValue*, std::__va_list)+271)
- D/SchedPolicy( 1350): #09 pc 0004cd34 /system/lib/libdvm.so
- D/SchedPolicy( 1350): #10 pc 00049382 /system/lib/libandroid_runtime.so
- D/SchedPolicy( 1350): #11 pc 00065e52 /system/lib/libandroid_runtime.so
- D/SchedPolicy( 1350): #12 pc 0001435e /system/lib/libbinder.so (android::BBinder::transact(unsigned int, android::Parcel const&, android::Parcel*, unsigned int)+57)
- D/SchedPolicy( 1350): #13 pc 00016f5a /system/lib/libbinder.so (android::IPCThreadState::executeCommand(int)+513)
- D/SchedPolicy( 1350): #14 pc 00017380 /system/lib/libbinder.so (android::IPCThreadState::joinThreadPool(bool)+183)
- D/SchedPolicy( 1350): #15 pc 0001b160 /system/lib/libbinder.so
- D/SchedPolicy( 1350): #16 pc 00011264 /system/lib/libutils.so (android::Thread::_threadLoop(void*)+111)
- D/SchedPolicy( 1350): #17 pc 000469bc /system/lib/libandroid_runtime.so (android::AndroidRuntime::javaThreadShell(void*)+63)
- D/SchedPolicy( 1350): #18 pc 00010dca /system/lib/libutils.so
- D/SchedPolicy( 1350): #19 pc 0000e3d8 /system/lib/libc.so (__thread_entry+72)
- D/SchedPolicy( 1350): #20 pc 0000dac4 /system/lib/libc.so (pthread_create+160)
- D/SchedPolicy( 1350): #00 pc 0000676c /system/lib/libcutils.so
- D/SchedPolicy( 1350): #01 pc 00006b3a /system/lib/libcutils.so (set_sched_policy+49)
- D/SchedPolicy( 1350): #02 pc 00016f26 /system/lib/libbinder.so (android::IPCThreadState::executeCommand(int)+461)
- D/SchedPolicy( 1350): #03 pc 00017380 /system/lib/libbinder.so (android::IPCThreadState::joinThreadPool(bool)+183)
- D/SchedPolicy( 1350): #04 pc 0001b160 /system/lib/libbinder.so