golang使用pprof檢查goroutine洩露

阿新 • • 發佈：2019-01-28

有一段時間，我們的推送服務socket佔用很不正常，我們自己統計的同時線上就10w的使用者，但是佔用的socket竟然達到30w，然後檢視goroutine的數量，發現已經60w+。

每個使用者佔用一個socket，而一個socket，有read和write兩個goroutine，簡化的程式碼如下：

c, _ := listerner.Accept()

go c.run()

func (c *conn) run() {
    go c.onWrite()
    c.onRead()
}

func (c *conn) onRead() {
    stat.AddConnCount(1)

    //on something

    stat.AddConnCount(-1)

    //clear
    //notify onWrite to quit
}

當時我就懷疑，使用者同時線上的統計是正確的，也就是之後的clear階段出現了問題，導致兩個goroutine都無法正常結束。在檢查程式碼之後，我們發現了一個可疑的地方，因為我們不光有自己的統計，還會將一些統計資訊傳送到我們公司的統計平臺，程式碼如下：

ch = make([]byte, 100000)
func send(msg []byte) {
    ch <- msg
}

//在另一個goroutine的地方，
msg <- msg
httpsend(msg)

我們channel的快取分配了10w，如果公司統計平臺出現了問題，可能會導致channel阻塞。但到底是不是這個原因呢？

幸運的是，我們先前已經在程式碼裡面內建了pprof的功能，通過pprof goroutine的資訊，發現大量的goroutine的當前執行函式在httpsend裡面，也就是說，公司的統計平臺在大併發下面服務不可用，雖然我們有http超時的處理，但是因為傳送的資料量太頻繁，導致整體阻塞。

臨時的解決辦法就是關閉了統計資訊的傳送，後續我們會考慮將其傳送到自己的mq上面，雖然也可能會出現mq服務不可用的問題，但是說句實話，比起自己實現的mq，公司的統計平臺更讓我不可信。

這同時也給了我一個教訓，訪問外部服務一定要好好處理外部服務不可用的情況，即使可用，也要考慮壓力問題。

對於pprof如何查看了goroutine的問題，可以通過一個簡單的例子說明:

package main

import (
    "net/http"
    "runtime/pprof"
)

var quit chan struct{} = make(chan struct{})

func f() {
    <-quit
}

func handler(w http.ResponseWriter, r *http.Request) {
    w.Header().Set("Content-Type", "text/plain")

    p := pprof.Lookup("goroutine")
    p.WriteTo(w, 1)
}

func main() {
    for i := 0; i < 10000; i++ {
        go f()
    }

    http.HandleFunc("/", handler)
    http.ListenAndServe(":11181", nil)
}

這上面的例子中，我們啟動了10000個goroutine，並阻塞，然後通過訪問http://localhost:11181/，我們就可以得到整個goroutine的資訊，僅列出關鍵資訊：

goroutine profile: total 10004

10000 @ 0x186f6 0x616b 0x6298 0x2033 0x188c0
#   0x2033  main.f+0x33 /Users/siddontang/test/pprof.go:11

可以看到，在main.f這個函式中，有10000個goroutine正在執行，符合我們的預期。

在go裡面，還有很多執行時檢視機制，可以很方便的幫我們定位程式問題，不得不讚一下。

golang使用pprof檢查goroutine洩露

golang使用pprof檢查goroutine洩露

Golang中不要使用無限迴圈檢查goroutine是否完成工作

Windows中使用CRT函式檢查記憶體洩露和溢位

VS2010檢查記憶體洩露

Go 筆記之如何防止 goroutine 洩露（二）

VC記憶體洩露檢查工具:VisualLeakDetector

iOS開發記憶體優化之自動檢測記憶體洩露，檢查是否有迴圈引用，檢查記憶體為何如此大，Block迴圈引用的檢查

C++記憶體洩露檢查工具

MLeaksFinder檢查洩露

防止記憶體洩露 Linux下用Valgrind做檢查

mysql日常檢查

$apply方法（觸發臟檢查機制）

sublime text 2 php 語法錯誤檢查

轉：Android檢查設備是否聯網

在一個文件中添加刪除檢查用戶腳本

oracle11g dataguard 備庫數據同步的檢查方法

Memcache 內存分配策略和性能(使用)狀態檢查

Unity Editor 檢查工程Prefab（預設）中的空組件

PMD 5.7.0 發布，Java 程序代碼檢查工具

idea xml 綠背景色去掉拼寫檢查

golang使用pprof檢查goroutine洩露

相關推薦