golang 幾種字串的連線方式
阿新 • • 發佈:2022-05-04
最近在做效能優化,有個函式裡面的耗時特別長,看裡面的操作大多是一些字串拼接的操作,而字串拼接在 golang 裡面其實有很多種實現。
實現方法
- 直接使用運算子
func BenchmarkAddStringWithOperator(b *testing.B) {
hello := "hello"
world := "world"
for i := 0; i < b.N; i++ {
_ = hello + "," + world
}
}
golang 裡面的字串都是不可變的,每次運算都會產生一個新的字串,所以會產生很多臨時的無用的字串,不僅沒有用,還會給 gc 帶來額外的負擔,所以效能比較差
- fmt.Sprintf()
func BenchmarkAddStringWithSprintf(b *testing.B) {
hello := "hello"
world := "world"
for i := 0; i < b.N; i++ {
_ = fmt.Sprintf("%s,%s", hello, world)
}
}
內部使用 []byte 實現,不像直接運算子這種會產生很多臨時的字串,但是內部的邏輯比較複雜,有很多額外的判斷,還用到了 interface,所以效能也不是很好
- strings.Join()
func BenchmarkAddStringWithJoin(b *testing.B) { hello := "hello" world := "world" for i := 0; i < b.N; i++ { _ = strings.Join([]string{hello, world}, ",") } }
join會先根據字串陣列的內容,計算出一個拼接之後的長度,然後申請對應大小的記憶體,一個一個字串填入,在已有一個數組的情況下,這種效率會很高,但是本來沒有,去構造這個資料的代價也不小
- buffer.WriteString()
func BenchmarkAddStringWithBuffer(b *testing.B) { hello := "hello" world := "world" for i := 0; i < 1000; i++ { var buffer bytes.Buffer buffer.WriteString(hello) buffer.WriteString(",") buffer.WriteString(world) _ = buffer.String() } }
這個比較理想,可以當成可變字元使用,對記憶體的增長也有優化,如果能預估字串的長度,還可以用 buffer.Grow() 介面來設定 capacity
測試結果
BenchmarkAddStringWithOperator-8 50000000 30.3 ns/op
BenchmarkAddStringWithSprintf-8 5000000 261 ns/op
BenchmarkAddStringWithJoin-8 30000000 58.7 ns/op
BenchmarkAddStringWithBuffer-8 2000000000 0.00 ns/op
這個是在我的自己 Mac 上面跑的結果,go 版本 go version go1.8 darwin/amd64,這個結果僅供參考,還是要以實際生產環境的值為準,程式碼在:https://github.com/hatlonely/...
主要結論 在已有字串陣列的場合,使用 strings.Join() 能有比較好的效能 在一些效能要求較高的場合,儘量使用 buffer.WriteString() 以獲得更好的效能 效能要求不太高的場合,直接使用運算子,程式碼更簡短清晰,能獲得比較好的可讀性 如果需要拼接的不僅僅是字串,還有數字之類的其他需求的話,可以考慮 fmt.Sprintf 參考連結 go語言字串拼接效能分析: http://herman.asia/efficient-...