二進位制流 字元流與字符集,字元庫,字元編碼
二進位制流與字元流
1.位和位元組都是單位,字元是看到的結果,解碼編碼則是固定的規則
2.在計算機儲存介質中存放的實際是二進位制的位元流
3.二進位制資料只是01資料 要顯示成我們所看到的字元要經過字元編碼以及對應的字符集,字元庫定位才能
找到這個二進位制所表達的字元
字符集 字元庫 字元編碼
1.字符集(Charset):是一個系統支援的所有抽象字元的集合。字元是各種文字和符號的總稱,包括各國家文字、標點符號、圖形符號、數字等。
2.字元編碼(Character Encoding):是一套法則,使用該法則能夠對自然語言的字元的一個集合(如字母表或音節表),與其他東西的一個集合(如號碼或電脈衝)進行配對。即在符號集合與數字系統之間建立對應關係,它是資訊處理的一項基本技術(二進位制與字元兩者之間的轉換規則)
3.字元庫:鍵值對應 按照對應編碼方式解析後對應字型檔表的編號
通俗一點來說 字元庫是字元的資料庫有自己的序號 與其一一對應的值是字符集 字元編碼是該如何解讀二進位制的規則
4.編碼字符集 :字元編碼與字元庫之間的對映
二進位制檔案與文字檔案
常見的二進位制檔案 如:特殊的檔案,圖片、音訊、視訊等等
常見的文字檔案有 記事本等等。
他們的差別是這樣的:
文字檔案是有通用的字符集的 如Unicode GBK ANSI 通用的字元庫Unicode字型檔 GBK字型檔 ANSI字型檔 通用的字元編碼 UTF-8 UTF-16 GBK GB1231 ANSI
特別的從字元編碼到字元庫還有一層編碼字符集 相當於一個對映
二進位制檔案沒有標準通用的字元編碼方式 常常是沒有通用協議的 有些協議是個人定義的 給特定的人去解析的 就像windows的許多二進位制檔案 你根本不知道是什麼 涉及到二進位制檔案加密
而文字檔案則有通用的加密 解碼方式 便於資料傳輸
以上純屬有部分屬於借鑑別人的看法 部分個人的理解 謹慎參考