Go 的 rune byte 和 string

阿新 • • 發佈：2019-01-02

rune 、 byte 和 string 都是 Go 的內建型別

byte
- byte是uint8的別名，在所有方面都等同於uint8
- 按慣例，它用於區分位元組值和8位無符號整數值。
rune
- rune是int32的別名，在所有方面都等同於int32
- 按慣例，它用於區分字元值和整數值。
string
- string是所有8位位元組字串的集合，通常但不一定代表UTF-8編碼的文字
- 字串可能為空，但是不能為 nil
- 字串型別的值是不可變的
由上面得解釋我們大概可以明白
- rune 可以表示得比 byte 多
- string 型別的底層是一個byte 陣列
- 以上解釋都來此 Go 原始碼註釋

剛剛上面標註了位元組和字元，現在我們來梳理字元和位元組的概念
儲存單位 位元組
- 計算機儲存資訊的最小單位，稱之為位 bit，二進位制的一個0或1叫一位
- 計算機儲存容量基本單位是位元組 Byte，8個二進位制位組成 1 個位元組
資訊表示單位字元
- 字元是一種符號，像英文a
  
  和中文阿 就是不同字元
- 不同的字元在不同的編碼格式下，所需要的儲存單位不一樣
  - ASCLII 編碼中一個英文字母一位元組，一個漢字兩位元組
  - UTF-8 編碼中一個英文字母一位元組，一個常見漢字3位元組，不常用的超大字符集漢字4位元組

Go 原始碼檔案預設採用Unicode字符集，Unicode碼點和記憶體中位元組序列的變換實現使用了UTF-8，這使得Go程式設計無需考慮編碼轉換的問題非常方便
從編碼上來分析
- byte用來強調一個位元組代表的資料（例如字元 a 就是 97
  
  ），而不是數字；
- rune用來表示Unicode的碼點，即一個字元
通俗一點
- byte 只能操作簡單的字元，不支援中文操作
- rune 能操作任何字元

程式碼演示

package main

import (
	"fmt"
	"unicode/utf8"
)

func main() {

	str := "hello 世界!"
	fmt.Println(str)              
	fmt.Println(len(str))
	fmt.Println(utf8.RuneCountInString(str))
	fmt.Println(str[1])
	fmt.Println(string(str[1]))
	fmt.Println(str[1:])
	fmt.Println(str[7:])

}

*************************************
輸出
hello 世界!
13
9
101
e
ello 世界!
��界!

會輸出 hello 世界!，這證明 Go 是UTF-8 編碼的，輸出長度為 13 這說明了一個漢字3位元組
輸出 ello 世界! 說明 string 底層的資料結構是陣列
輸出 ��界! 說明 string 底層是一個byte 陣列，不然不會亂碼

package main

import "fmt"

func StrChangeByRune(str *string, i int, ch rune) {

	temp := []rune(*str)
	temp[i] = ch
	*str = string(temp)
}

func StrChangeByByte(str *string, i int, ch byte) {

	temp := []byte(*str)
	temp[i] = ch
	*str = string(temp)
}

func main() {

	str := "你好 hello"
	str1 := "你好 hello"
	StrChangeByRune(&str, 1, 'A')
	StrChangeByByte(&str1, 1, 'A')
	fmt.Println(str)
	fmt.Println(str1)

}


*******************************
輸出
你A hello
�A�好 hello

由輸出 你A hello 和 �A�好 hello 可以看出
byte 的操作單位是一個位元組，可以理解為一個英文字元
rune 的操作單位是一個字元，不管這個字元是什麼字元

Go 的 rune byte 和 string

rune 、 byte 和 string 都是 Go 的內建型別 byte byte是uint8的別名，在所有方面都等同於uint8 按慣例，它用於區分位元組值和8位無符號整數值。 rune

js byte[] 和string 相互轉換 UTF-8

function stringToByte(str) { var bytes = new Array(); var len, c; len = str.length; for(var i = 0; i < len; i++) { c = str.charCode

Java之byte、char和String類型相互轉換

rac static rgs div body valueof () print byte[] 1 package basictype; 2 3 /** 4 * byte、char和String類型相互轉換 5 */ 6 public class C

Go語言-基本型別（int，float，bool，byte，string）

1 函式格式定義格式： func functionName(para1 para1Type, para2 para2Type) (ret1 ret1Type, ret2 ret2Type) { ... } 函式名用駱駝命名法。 main函式無引數無返回。其他函

go語言帶cookie的net客戶端請求與[]byte轉string

前些日子參加了一個叫Advent of Code的程式設計大賽，每天一道題，快活似神仙。這每道題都有自己的拼圖資料輸入puzzle input，要做題就需要用到該資料，把資料複製過來感覺又太麻煩，於是就興起寫了一個直接從html讀取資料的函式。其資料如下： +12 -10 -4 -8 +18 -1 -13

Golang rune []byte string 的相互轉換

rune在一些流行程式語言中並沒有對應的資料型別。因此首要需要先搞清楚這到底是個啥，否則這個大坑能埋很多人。且看程式碼 func main(){ str := "名稱Tom" fmt.Println(len(str)) fmt.Pr

golang byte和rune的區別

我們知道golang中的string型別儲存的字串是不可變的，如果要修改string內容需要將string轉換為[]byte或[]rune，並且修改後的string內容是重新分配的。那麼byte和rune的區別是什麼呢？其實很簡單，直接看gola

用java String類的getBytes(String charsetName)和String(byte[] bytes, String charsetName)解決亂碼問題

Java中String的資料是如何儲存的,檢視原始碼就可以知道,String的資料是儲存在char[] value這樣一個成員變數中的,char型別的大小在java中是2個位元組我們還知道,現在普遍使用的unicode版本是UCS-2,就是使用2個位元組表示一個字元的unicode版本,這就對上了,java

byte陣列和String之間的相互轉換程式碼

public static String converByteToString(byte[] data) { ByteArrayInputStream byteInput = null; GZIPInputStream gzin = null; ByteArra

C# byte[]型別和String型別相互轉換

String型別轉成byte[]： byte[] byteArray = System.Text.Encoding.UTF8.GetBytes ( strvalue ); byte[]轉成String： String str = System.Text.Encoding.U

Java中實現String.padLeft和String.padRight

toc 還要 color for 失去 1-1 arraycopy ace pre 因為習慣了C#中的padLeft和padRight，接觸Java後突然失去這兩個功能，覺得別扭，就試著實現了這兩個方法。 Java中String.format()中帶有字符串對齊功能如下

InputStream只能讀取一次的解決辦法 C# byte[] 和Stream轉換

eof nbsp pos 讀取處理搜索 post ... 還要 x 情景--->>> 導入文件的時候,前臺傳過來一個文件，後臺接到: HttpPostedFileBase file = Request.Files[0];由於對這個文件後臺處理

字節數組byte[]和整型,浮點型數據的轉換——Java代碼

amp gravity img 如何 class 機器保存 clas -m 近期在寫C++ socket和java socket之間的通信程序，涉及到整數浮點數的傳輸。須要從字節數組還原數據，查了一些資料。總結例如以下 1. 整數和浮點數的機器表示在機器

對於JVM中方法區，永久代，元空間以及字符串常量池的遷移和string.intern方法

ase ane 虛擬機影響一個 tle 自定義類加載器機器 img 在Java虛擬機（以下簡稱JVM）中，類包含其對應的元數據，比如類的層級信息，方法數據和方法信息（如字節碼，棧和變量大小），運行時常量池，已確定的符號引用和虛方法表。在過去（當自定義類加載器使用

轉載：string.IsNullOrEmpty和string.IsNullOrWhiteSpace方法的區別

char ace length string pty div isn 如果使用 string.IsNullOrEmpty():判斷字符串是否為null或者為string.Empty,如果是"\t"這樣的字符就返回false,為了達到判斷過濾這些功能，就要使用Trim()和

JAVA中string.replace()和string.replaceAll()的區別及用法

mod btn dsm ont match cep 產生生成語法乍一看，字面上理解好像replace只替換第一個出現的字符（受javascript的影響），replaceall替換所有的字符，其實大不然，只是替換的用途不一樣。 public Strin

關於byte[]和字符串的轉換

urn get () cnblogs rto blog str turn sta public static String byteToStr(byte[] b) { return new String(b); } public static b

Javascript Array和String的互轉換

參數傳遞如果 red array類 gre blue bsp new val Array類可以如下定義： var aValues = new Array(); 如果預先知道數組的長度，可以用參數傳遞長度 var aValues = new

snprintf和string操作函數

string.h .html char s 必須 edittext 不同 get 打印位置首先，使用場景不同。除了snprintf之外，其他的都是用於兩個字符串之間進行比較、拷貝、拼接等操作的，而snprintf最主要是，要把一個用戶變量按照一個format打印到字符串

StringBuffer和String,StringBuilder的區別?

序列不同字符參數比較不能不可變基本同步始終在內存中返回是一個字符串! String類:一旦被賦值,其值不能再改變,(不可變的字符序列)String類作為形式參數傳遞,效果和基本數據類型一樣對實際參數沒有影響,String比較耗內存,(St

Go 的 rune byte 和 string

相關推薦