gethostbyname超時,與遇到的一些坑
阿新 • • 發佈:2018-09-04
出現 測試 arm 結果 時間 turn 阻塞 block thread 現網有些DNS服務器質量不好,經常不返回,導致服務器在做DNS請求時經常被卡住,簡單測試後發現如果服務器不返回結果,一般20+秒超時。
但是如果使用alarm和signal,是不能中斷系統函數的,參考了一些網絡上的資料,可以設置sigsetjmp和siglongjmp來打斷系統函數,並可以恢復之前的堆棧,避免發生問題。
但是如果使用alarm和signal,是不能中斷系統函數的,參考了一些網絡上的資料,可以設置sigsetjmp和siglongjmp來打斷系統函數,並可以恢復之前的堆棧,避免發生問題。
static sigjmp_buf jmpbuf; static void alarm_func(int sig_no) { siglongjmp(jmpbuf, 1); } struct hostent *gngethostbyname(const char *HostName, int timeout) { struct hostent *lpHostEnt; signal(SIGALRM, alarm_func); if(sigsetjmp(jmpbuf, 1) != 0) { alarm(0);//timout signal(SIGALRM, SIG_IGN); return NULL; } alarm(timeout);//setting alarm lpHostEnt = gethostbyname(HostName); signal(SIGALRM, SIG_IGN); return lpHostEnt; }
在實驗離職裏面非常好用,但是在實際代碼中發現出現了異常
Thread 22 (Thread 0x7fffccff9700 (LWP 25722)): #0 0x00000038b7addfc3 in poll () from /lib64/libc.so.6 #1 0x00000038b960bed4 in __libc_res_nsend () from /lib64/libresolv.so.2 #2 0x00000038b960876a in __libc_res_nquery () from /lib64/libresolv.so.2 #3 0x00000038b9608d29 in __libc_res_nquerydomain () from /lib64/libresolv.so.2 #4 0x00000038b96099cf in __libc_res_nsearch () from /lib64/libresolv.so.2 #5 0x00007fffec5f62d8 in _nss_dns_gethostbyname3_r () from /lib64/libnss_dns.so.2 #6 0x00007fffec5f650e in _nss_dns_gethostbyname_r () from /lib64/libnss_dns.so.2 #7 0x00000000ffffffff in ?? () #8 0x0000000000000002 in ?? () #9 0x0000000000000005 in ?? () #10 0x0000000000205098 in ?? () #11 0x0000000000000000 in ?? ()
發現子線程的堆棧變成了??? 而主線程的堆棧變成了子線程的堆棧。
研究發現,應該是gethostbyname是在子線程調用的,而信號是主線程處理,導致子線程備份的堆棧內容被覆蓋到了主線程裏,引起了問題。
在主線程裏屏蔽掉SIGALRM信號
sigset_t mask,oldmask;
sigemptyset(&mask);
sigaddset(&mask,SIGALRM);
pthread_sigmask(SIG_BLOCK,&mask,&oldmask);
在子線程裏解鎖對信號的屏蔽
sigset_t mask,oldmask; sigemptyset(&mask); sigaddset(&mask,SIGALRM); pthread_sigmask(SIG_UNBLOCK,&mask,&oldmask);
繼續運行,一些正常,可以按照配置的超時時間結束系統函數的阻塞。
gethostbyname超時,與遇到的一些坑