非數值資料的編碼表示
阿新 • • 發佈:2020-09-21
2.5非數值資料的編碼表示
2.5.1西文字元
ASCLL碼(美國標準資訊交換碼)
2.5.2漢字字元
漢字的輸入碼(外碼)
每個漢字都用一個或者幾個鍵來表示,這種對每個漢字用相應的按鍵進行的編碼表示就稱為漢字的輸入碼,又稱外碼。
字符集與漢字內碼
漢字被輸入到計算機內部後,就按照一種稱為內碼的編碼形式在系統中進行儲存、查詢、傳送等處理。
對於漢字內碼的選擇:
1.不能有二義性,即不能和ascll碼有相同的編碼。
2.要與漢字在字型檔中的位置有關係,以便於漢字的處理、查詢。
3.編碼應儘量短。
國標碼(國際交換碼)
共6763個常用漢字。
2.6資料的寬度和儲存
1.二進位制資料的每一位是組成二進位制資訊的最小單位,稱為一個位元(bit),也稱為位元,簡稱位。位元是計算機中處理、儲存、傳輸資訊的最小單位。
每個西文字元需要8個位元表示,每個漢字需要用16個位元表示。
2.二進位制資訊的計量單位是位元組(byte),也成位組。一個位元組==8個位元。
3.字長通常是指CPU內部用於整數運算的資料通路的寬度。
2.7資料校檢碼
1.方法大都採用冗餘校驗的思想,即除原資料資訊外,還增加若干位編碼,這些新增的程式碼稱為校驗位。
2.由若干位程式碼組成的一個字叫碼字,將兩個碼字逐位比較,具有不同程式碼的位的個數叫做這兩個碼字間的距離,也稱為海明距離。一種碼制可能有若干個碼字,各碼字間的最小距離稱為碼距。
校驗碼的方式
1.奇偶校驗碼
2.海明校驗碼
3.迴圈冗餘碼