1. 程式人生 > 其它 >位元組,字元,bit,byte的關係

位元組,字元,bit,byte的關係

1、計算機儲存資訊的最小單位,稱之為位(bit),音譯為位元,二進位制的一個“0”或一個“1”叫一位。
2、計算機儲存容量基本單位是位元組(Byte),音譯為拜特,8個二進位制位組成1個位元組。一般而言:一個標準英文字母佔一個位元組位置,一個標準漢字佔二個位元組位置。
3、計算機儲存容量大小以位元組數來度量,1024進位制:
  1B=8bit
  1024B=1K(千)B
  1024KB=1M(兆)B
  1024MB=1G(吉)B
4、字元是一種符號,同以上說的儲存單位不是一回事。
  1個位元組=8個bit位,每個bit位又0/1兩種狀態,也就是說一個位元組可以表示256個狀態,計算機裡用位元組來作為最基本的儲存單位。
  一個字元=1KB,一個字母或數字(稱之為字元)佔用一個位元組,
  一個漢字=2KB,一個漢字用兩個位元組表示,
  在不同的編碼方式下一個字元佔的位元組不太一樣。
  按照ANSI編碼標準,標點符號、數字、大小寫字母都佔一個位元組,漢字佔2個位元組。
  按照UNICODE標準所有字元都佔2個位元組。
5、不同編碼裡,字元和位元組的對應關係不同:
①ASCII碼中:一個英文字母(不分大小寫)佔一個位元組的空間,一箇中文漢字佔兩個位元組的空間。
一個二進位制數字序列,在計算機中作為一個數字單元,一般為8位二進位制數,換算為十進位制。最小值0,最大值255。

UTF-8編碼中:一個英文字元 = 一個位元組,一個中文(含繁體) =  三個位元組。

③Unicode編碼中:一個英文字元等於兩個位元組,一箇中文(含繁體)等於兩個位元組。
      符號:英文標點佔一個位元組;中文標點佔兩個位元組。
      舉例:英文句號“.”佔1個位元組的大小;中文句號“。”佔2個位元組的大小。