1. 程式人生 > >golang 八進位制 utf-8 編碼轉中文

golang 八進位制 utf-8 編碼轉中文

當除錯程式,打印出變數的值時,有可能輸出的是八進位制 utf-8 編碼(尤其是 protobuf 變數)
例如:\346\200\241\346\200\241\346\200
這樣的字串如果作為字面量,go可以自動轉化,
但如果是從檔案或string中讀取,就不行了。
可以使用正則表示式簡單處理下
如下程式碼示例:

package main

import (
    "fmt"
    "regexp"
    "strconv"
)

// 轉換8進位制utf-8字串到中文
// eg: `\346\200\241` -> 怡
func convertOctonaryUtf8(in string) string {
    s := []byte(in)
    reg := regexp.MustCompile(`\\[0-7]{3}`)

    out := reg.ReplaceAllFunc(s,
        func(b []byte) []byte {
            i, _ := strconv.ParseInt(string(b[1:]), 8, 0)
            return []byte{byte(i)}
        })
    return string(out)
}

func main() {
    s1 := "\346\200\241" // 字面量
    s2 := `\346\200\241` // 原始字串

    fmt.Println("s1 =", s1)
    fmt.Println("s2 =", s2)

    // 轉化 s2
    s3 := convertOctonaryUtf8(s2)
    fmt.Println("s3 =", s3)
}

執行結果:
示例執行結果