1. 程式人生 > >ASCII碼與unicode字符集

ASCII碼與unicode字符集

問題1:為什麼需要字元ASCII碼、unicode碼等等???它們到底有什麼作用?

    首先要明白一個事實:在計算機中只能用一系列儲存著的0和1,當我們把一個字元存放在計算機時,我們是如何表示常用的字元呢??這就用到了字元編碼集。 而具體怎麼編碼的,就涉及到了常使用的編碼方式,比如本文要介紹的ASCII編碼與unicode編碼,它們的作用就是實現字元與0-1串之間的一一對映。

ASCII碼:

它使用一個位元組(即8個二進位制位)來對映128個字元。其中,它只用於了8位中的7位,2^7=128。下面是部分ASCII碼錶:

image

unicode碼/unicode字符集:

unicode字符集把全世界所有的字元都統一起來了, 它為每一個字元分配了一個唯一的數字,這些數字的範圍為:0x0000-0x10ffff(16進製表示)。歸定了把這些編碼數字分為了17個平面,即:

0x0000-0xffff:基本平面;

0x10000-0x1ffff: 第一平面;

0x20000-0x2ffff: 第二平面;

0x30000-0x3ffff: 第三平面;

0x40000-0x4ffff: 第四平面;

0x50000-0x5ffff: 第五平面;

0x60000-0x6ffff: 第六平面;

0x70000-0x7ffff: 第七平面;

0x80000-0x8ffff: 第八平面;

0x90000-0x9ffff: 第九平面;

0xa0000-0xaffff: 第十平面;

0xb0000-0xbffff: 第十一平面;

0xc0000-0xcffff: 第十二平面;

0xd0000-0xdffff: 第十三平面;

0xe0000-0xeffff: 第十四平面;

0xf0000-0xfffff: 第十五平面;

0x100000-0x10ffff: 第十六平面;

unicode字符集只時規定了每一個字元對應的unide編碼值。具體這個值如何在計算機中儲存,可以分為多種方法,包括:utf-8,utf-16, utf-32。

又TM的沒寫完,回家了,不寫了。

相關推薦

ASCIIunicode字符集

問題1:為什麼需要字元ASCII碼、unicode碼等等???它們到底有什麼作用?     首先要明白一個事實:在計算機中只能用一系列儲存著的0和1,當我們把一個字元存放在計算機時,我們是如何表示常用的字元呢??這就用到了字元編碼集。 而具體怎麼編碼的,就涉及到了常使用的編碼方式,比如本文要介紹的ASCII編

ascii二進制有何區別?

text info asc lin 二進制 -s ascii碼 國際 iso ascii編碼和二進制碼是兩個概念。ASCII主要是為了電腦顯示和傳輸拉丁字母而發明的一套編碼,二進制則是為了計算機方便計算、傳輸數據而使用的一種方法。ASCII(American Stan

GB2312、GBK、ISO-8859-1、ASCIIUnicode、UTF-8各種編碼格式詳解(終於搞懂了)

從計算機編碼歷史這條主線來理解各種編碼格式 計算機發明於歐美語系世界,最初只需要處理英文字母的編碼就可以了,也就是ISO-8859-1編碼規範;後來傳到中國,原有的編碼規範不能識別中文,於是發展出了GB2312、GBK等格式來編碼中文,同樣的對於阿拉伯語系、德俄西班牙之類的也會有其相應的編碼

PAT甲級1024 ASCII整數轉換

題目 A number that will be the same when it is written forwards or backwards is known as a Palindromic Number. For example, 1234321 i

ASCII字元互轉,python

ord():字元轉成ASCII碼,引數為字元。 chr():ASCII碼轉成字元,引數為數字(0-127) >>> help(ord) # ord的幫助文件 Help on built-in function ord in module builtins:

Python中ASCII字元的轉化

Python內建ord函式用來將字元轉化成ASCII碼用法為:print('字元0 的ASCII碼錶示為',ord('0'))結果為:字元0 的ASCII碼錶示為 48Python內建chr函式用來將ASCII碼化成字元用法為:print('ASCII碼為97對應的字元為',

ASCIIUnicode編碼對照表 —— ASCII控制字元 Unicode編碼 字元編碼的前世今生

ASCII控制字元  Unicode編碼ASCII(American Standard Code for Information Interchange,美國資訊互換標準程式碼,ASCⅡ)是基於拉丁字母的一套電腦編碼系統。它主要用於顯示現代英語和其他西歐語言。它是現今最通用的

python中字母ascii的相互轉換

需要 編碼 方法 由於 nic 否則 python int bsp 在做python編程時,碰到了需要將字母轉換成ascii碼的,原本以為用Int()就可以直接將字符串轉換成整形了,可是int()帶了一個默認參數,base=10,這裏表示的是十進制,若出現字母,則會報錯,認

編碼格式簡介:ASCII、ANSI、GBK、GB2312、GB18030和Unicode、UTF-8,BOM頭

family 用兩個 圖片 and 正是 全球化 asc 即使 little 編碼格式簡介:ASCII碼、ANSI、GBK、GB2312、GB18030和Unicode、UTF-8,BOM頭 二進制: 只有0和1。 十進制、十六進制、八進制: 計算機其實挺笨的,它只

java 字符ASCII互轉

方法 style println span har pos system pan blog 字符轉對應ASCII碼 // 方法一:將char強制轉換為byte char ch = ‘A‘; byte byteAscii = (byte) ch; System.out.

python中的字符串編碼問題——2.理解ASCII、ANSIUnicode編碼、UTF-8編碼

unicode編碼 統一 col 簡單 utf 文字 stand 二進制 pan ASCII碼:全名是American Standard Code for Information Interchange,ASCII碼中,一個英文字母(不分大小寫)占一個字節的空間,範圍0x0

js字元ASCII互轉的方法

大寫字母A-Z對應的ASCII碼值是65-90 小寫字母a-z對應的ASCII碼值是97-122 將字母轉為ascii嘛的方法: var str = "A"; str.charCodeAt(); // 65 var str1 = 'a'; str1.charCodeAt()

java字元對應Ascii互轉

圖題 程式碼如下: [java]  view plain  copy pack

C/C++中ASCIIUnicode字串相互轉換

轉載地址:https://blog.csdn.net/wbq2018/article/details/8806431 1、ASCII to Unicode 函式: wcstombs(VC6)、wcstombs_s 例項: //crt_wcstombs_s.c //This examp

編碼表(ASCII&GB2312&gbk&unicode&UTF-8)

                                          &

將一個字元對應Ascii互轉

package nicetime.com.practies; /** * Java中將一個字元與對應Ascii碼互轉 1 byte = 8bit 可以表示 0-127 */public class GenerateASCIIDigit { /* * 0-9對應Ascii 48-57 A-Z 65-90

帶你玩轉Visual Studio——帶你理解多位元組編碼Unicode

轉自:http://blog.csdn.net/luoweifu/article/details/49382969 多位元組字元與寬位元組字元 char與wchar_t 我們知道C++基本資料型別中表示字元的有兩種:char、wchar_t。  char叫多位

二進位制十六進位制ASCII

目錄 字元 二進位制與十六進位制 二進位制   ------>   每位只能用0,1表示 二進位制到十進位制的轉換   ------>   110 = 1*2^2 +

C語言 16進位制ascii互轉

/*把ASCII字元轉換為16進位制 */ uint8_t char_to_hex(const uint8_t *ch) { uint8_t value = 0; if(*ch >= 0 && *ch <= 9

[Leetcode] 387. 字串中的第一個唯一字元 java hashmapASCII

給定一個字串,找到它的第一個不重複的字元,並返回它的索引。如果不存在,則返回 -1。 案例: s = "leetcode" 返回 0. s = "loveleetcode", 返回 2. 注意事項:您可以假定該字串只包含小寫字母。 第一種方法(hashmap略慢)