1. 程式人生 > 程式設計 >golang 獲取字串長度的案例

golang 獲取字串長度的案例

1.不同字元與獲取字串長度

獲取字串長度,是字串操作的重要方法。理論來說,獲取字串長度,只要從頭到尾查詢一遍就可以了。但遺憾的是,不同字元具有不同的編碼格式。拉丁字母一個字元只要一個位元組就行,而中文則可能需要兩道三個位元組;UNICODE把所有字元設定為2個位元組,UTF-8格式則把所有字元設定為1--3個位元組。

因此,字串長度的獲得,不等於按位元組數查詢,而要根據不同字元編碼查詢。

2.golang中獲取字串長度的方法

對於中文開發者來說,經常需要對字串進行長度判斷。golang有自己的預設判斷長度函式len();但遺憾的是,len()函式判斷字串長度的時候,是判斷字元的位元組數而不是字元長度。因此,在中文字元下,應該採用如下方法:

1)使用 bytes.Count() 統計

2)使用 strings.Count() 統計

3)將字串轉換為 []rune 後呼叫 len 函式進行統計

4)使用 utf8.RuneCountInString() 統計

3.樣例展示

s := "歡迎學習Go的len()函式"
r := []rune(strTest)
fmt.Println(len(r))
fmt.Println(len(s))
fmt.Println(bytes.Count([]byte(s),nil) - 1)
fmt.Println(strings.Count(s,"") - 1)
fmt.Println(utf8.RuneCountInString(s))

補充:Go語言獲取中英文混和字串的長度以及子字串的方法

1. 純英文字串

使用len()函式。

testString1 := "China!"
length1 := len(testString1)
fmt.Printf("testString1 字串的長度是:%d",length1)

長度是6。

2. 中英文混合字串

2.1 先使用len()函式。

testString2 := "我愛你中國,我愛你China!"
length2 := len(testString2)
fmt.Printf("字串的長度是:%d",length2)
fmt.Printf("testString2字串的長度是:%d\n",length2)
fmt.Printf("testString2中的最後一個字元是:%s\n",testString2[length2-1])
fmt.Printf("testString2中的最後一個字元是:%c\n",testString2[length2-1])
fmt.Printf("testString2中的下標6-末尾的子字串是:%s\n",testString2[:15])
fmt.Printf("testString2中的下標6-末尾的子字串是:%s\n",testString2[:16])

這種方法的到的是位元組數。Go語言中,中文字元按utf-8編碼,佔3位元組,故長度是31。故此方法不適用統計中英文混合或者中文字串長度。

2.2 使用utf8.RuneCountInString()方法。

testString2 := "我愛你中國,我愛你China!"
length3 := utf8.RuneCountInString(testString2)
fmt.Printf("使用utf8中的方法統計的字串長度是:%d\n",length3)

此方法可統計字元數,輸出結果是15。

2.3 轉成[]rune型別,再對此型別進行操作

testString2 := "我愛你中國,我愛你China!"
temp := []rune(testString2)
length4 := len(temp)
fmt.Printf("使用rune統計的字串的長度是:%d\n",length4)
//獲取字串中最後一個字元
lastChar := string(temp[length4-1])
//獲取下標從0到3(不包括3)的子串
subString1 := temp[0:3]
subString2 := temp[6:9]
fmt.Printf("testString2中的最後一個字元是:%s\n",lastChar)
fmt.Printf("testString2中的下標0-2的子字串是:%s\n",string(subString1))
fmt.Printf("testString2中的下標6-8的子字串是:%s\n",string(subString2))

此方法也可輸出字元個數15。但是此方法能獲取指定下標範圍的子字串,也能獲取指定下標位置的字元。比第二種方法方便。

3.示例程式碼

package main
import (
 "fmt"
 "unicode/utf8"
)
func main() {
 //純英文
 testString1 := "China!"
 length1 := len(testString1)
 fmt.Printf("testString1字串的長度是:%d\n",length1)
 lastCharA := testString1[length1-1]
 //此處用%s格式輸出最後一個字元會出錯,只能用%c
 fmt.Printf("testString1字串中最後一個字元是:%s\n",lastCharA)
 fmt.Printf("testString1字串中最後一個字元是:%c\n",lastCharA)
 fmt.Printf("testString1中的下標0-2的子字串是:%s\n",testString1[0:3])
 fmt.Printf("testString1中的下標3-末尾的子字串是:%s\n",testString1[3:])
 fmt.Println()
 //中英文加一起15個字元
 testString2 := "我愛你中國,我愛你China!"
 //此處長度是輸出位元組數,Go語言中文字元是UTF-8編碼,長度3位元組,故此處應該是15+1+9+6=31
 length2 := len(testString2)
 fmt.Printf("testString2字串的長度是:%d\n",length2)
 fmt.Printf("testString2中的最後一個字元是:%s\n",testString2[length2-1])
 fmt.Printf("testString2中的最後一個字元是:%c\n",testString2[length2-1])
 fmt.Printf("testString2中的下標6-末尾的子字串是:%s\n",testString2[:15])
 fmt.Printf("testString2中的下標6-末尾的子字串是:%s\n",testString2[:16])
 fmt.Println()
 //此處就是統計字元數
 length3 := utf8.RuneCountInString(testString2)
 fmt.Printf("使用utf8中的方法統計的字串長度是:%d\n",length3)
 fmt.Println()
 //轉成rune型別,再統計字元數
 temp := []rune(testString2)
 //獲取中英文混合字串長度
 length4 := len(temp)
 fmt.Printf("使用rune統計的字串的長度是:%d\n",length4)
 //獲取字串中最後一個字元
 lastCharB := string(temp[length4-1])
 //獲取下標從0到3(不包括3)的子串
 subString1 := temp[0:3]
 subString2 := temp[6:]
 fmt.Printf("testString2中的最後一個字元是:%s\n",lastCharB)
 fmt.Printf("testString2中的下標0-2的子字串是:%s\n",string(subString1))
 fmt.Printf("testString2中的下標6-末尾的子字串是:%s\n",string(subString2))
}

4. 示例結果

golang 獲取字串長度的案例

總結

如果是對中英文進行操作,建議用第三種方式。先轉成rune[]型,再進行操作。

以上為個人經驗,希望能給大家一個參考,也希望大家多多支援我們。如有錯誤或未考慮完全的地方,望不吝賜教。