計算機編碼方式
阿新 • • 發佈:2017-12-07
sci 方便 alt ascii 內置 技術 空間 可能 其他
首先需要弄明白一件事,計算機只能識別0,1。因此字符什麽的需要編碼進行存儲。
計算機是由老外發明的,他們可沒有什麽漢字 ,只有ABCD....,所以呢,最早的編碼
是ASCII編碼,最開始是給128個字符進行編碼。
但這顯然是不行的啊,世界上除了英語,還有那麽多其他語言,因此ASCII碼顯然不適合
這種情況。
於是又有了Unicode編碼方式,俗稱萬國碼,可以存儲好幾萬個字符。但是又有新的問題
出現了,Unicode碼不適合存儲啊,因為Unicode是定長編碼,非常浪費存儲空間,
這裏又有了一種新的編碼方式:utf-8。utf-8繼承了unicode碼,采用的是不定長編碼,大大
節約了存儲空間。在數據存儲和傳輸方面非常方便。
當然還有像gbk專門針對中文的編碼方式,Shift_JIS針對日文的編碼方式.....................
總之,編碼方式很多,但在計算機內存中的編碼方式一定是unicode編碼,因為操作系統不可能
內置好幾十種編碼方式,而是在內存中采用unicode編碼,這樣的話從其他編碼方式解碼成unicode
碼這一過程就可以讓其他程序開發者來完成。
以下圖為例:
一個文本文檔的讀取和保存到磁盤的過程如上圖所示
計算機編碼方式