ASCII碼字符集

阿新 • • 發佈：2020-10-19

為什麼有ASCII碼

計算機儲存和傳輸的資料必須是二進位制,也就是說所有的資訊都要轉換成0和1表示。在兩臺通訊裝置之間通訊的時候，比如要傳輸字元a，傳送裝置把a編碼為0和1組成的序列，併發送出去，介面裝置如何正確地的理解這個0和1序列呢？這就像兩個人之間對話一樣，如果兩個人使用的是不同的語言，那麼他們會存在溝通障礙。同樣的地，計算機裝置之間也需要統一的編碼標準，把字元編碼為統一的0和1序列，傳送之前進行二進位制編碼，接收的裝置只要按照相同的規則解析，就可以讀取出來資訊了。統一的編碼方案成為資訊能夠正確儲存和傳輸的前提。

ASCII（American Standard Code for Information Interchange）美國資訊交換標準程式碼，它是對字母、數字、符號進行二進位制編碼的標準。一個ASCII碼長度是一個位元組，也就是8個bit，最高位是0作為校驗位，其餘7位使用0和1進行組合，所以ASCII碼共有128個。這128個字元包含33個控制字元和95個可顯示字元。0-31以及127是控制字元，包含DEL刪除，BS退格，CR回車等。32-126是可顯示字元，其中32是回車，48-57是10個阿拉伯數字，65-90是26個大寫的英文字母，97-122是26個小寫的英文字母。

ASCII碼錶格

127個ASCII字元和數字是一一對應的關係，表格中展示的為十進位制表示，在計算機傳輸和儲存中，會把他們轉換為二進位制，比如數字0的十進位制表示為48，轉換為二進位制就是00110000，在不同的裝置中互相傳輸的就是這個二進位制序列。

ASCII值	ASCII字元	ASCII值	ASCII字元	ASCII值	ASCII字元	ASCII值	ASCII字元
0	NUT	32	(space)	64	@	96	、
1	SOH	33	!	65	A	97	a
2	STX	34	"	66	B	98	b
3	ETX	35	#	67	C	99	c
4	EOT	36	$	68	D	100	d
5	ENQ	37	%	69	E	101	e
6	ACK	38	&	70	F	102	f
7	BEL	39	,	71	G	103	g
8	BS	40	(	72	H	104	h
9	HT	41	)	73	I	105	i
10	LF	42	*	74	J	106	j
11	VT	43	+	75	K	107	k
12	FF	44	,	76	L	108	l
13	CR	45	-	77	M	109	m
14	SO	46	.	78	N	110	n
15	SI	47	/	79	O	111	o
16	DLE	48	0	80	P	112	p
17	DCI	49	1	81	Q	113	q
18	DC2	50	2	82	R	114	r
19	DC3	51	3	83	S	115	s
20	DC4	52	4	84	T	116	t
21	NAK	53	5	85	U	117	u
22	SYN	54	6	86	V	118	v
23	TB	55	7	87	W	119	w
24	CAN	56	8	88	X	120	x
25	EM	57	9	89	Y	121	y
26	SUB	58	:	90	Z	122	z
27	ESC	59	;	91	[	123	{
28	FS	60	<	92	/	124	\|
29	GS	61	=	93	]	125	}
30	RS	62	>	94	^	126	`
31	US	63	?	95	_	127	DEL

ASCII字元侷限性

可以發現，ACSII字元最高位置0的情況下，最多表示128個字元，英文字元完全可以被編碼，如果是其他語言，字元數量多於127個如何表示呢？一些國家對ASCII碼做了擴充套件，讓最高位也參與編碼，這樣ASCII碼能表示的字元數量從128個上升到256個，這種編碼ASCII也被成為擴充套件ASCII編碼。

然而，擴充套件ASCII編碼仍然有很大侷限性，世界上有很多中語言文字，每種語言的字元數量不一，256個依然是不夠用的。漢字的數量大約接近十萬個，常用漢字大約六千個，如何實現漢字編碼呢？此類情況，其他語言也是存在。每個國家都將自己的語言編碼為某個標準，標準不統一，導致計算機裝置在傳輸資訊過程中出現亂碼。Unicode編碼的出現，它採用兩個位元組對接字元編碼，理論上可以有256*256=65536個字元，解決了編碼數量過少問題，同時，它也是通用的編碼標準，避免了資訊傳輸中亂碼問題。

Unicode標準成為了國際認可的編碼標準，但在推廣過程中受到歐美國家的反對，他們的理由很簡單，在ASCII編碼體系下，他們字元編碼僅僅需要一個位元組，而Unicode採用了兩個位元組，儲存空間佔用直接變為兩倍，同時他們所有的文字處理程式都需要重寫，工作量很大，如果採用兩個位元組編碼他們是無法接受的。網際網路的普及強烈要求統一的編碼格式，utf-8編碼後來成為了通用編碼方式。它採用變長編碼，使用1-4個位元組表示一個符號，根據符號的不同，變化位元組長度。對於ASCII碼，它在utf-8中的編碼保持不變，仍是一個位元組，原來處理ASCII字元的程式幾乎不需要改變，可以繼續使用。但對於中文來說，中文字元在utf-8中佔用3個位元組，在Unicode標準中需要兩個位元組，使用utf-8編碼後，中文資訊傳輸佔用的流量變為1.5倍。

ASCII碼字符集

為什麼有ASCII碼計算機儲存和傳輸的資料必須是二進位制,也就是說所有的資訊都要轉換成0和1表示。在兩臺通訊裝置之間通訊的時候，比如要傳輸字元a，傳送裝置把a編碼為0和1組成的序列，併發送出去，介面裝

ASCII碼對照表以及各個字元的解釋(精華版)

ASCII（American Standard Code for Information Interchange，美國資訊互換標準程式碼）是一套基於拉丁字母的字元編碼，共收錄了 128 個字元，用一個位元組就可以儲存，它等同於國際標準 ISO/IEC 646。

C++如何實現BCD碼和ASCII碼互轉

#include<iostream> #include<stdlib.h> #include<string> using namespace std; string ASCII2BCD(const string &str)

java map裡面進行ASCII 碼從小到大排序（字典序）

public static String getAsciiSort(Map<String, Object> map) {List<Entry<String, Object>> infoIds = new ArrayList<Entry<String, Object>>(map.entrySet());// 對所有傳入引數按

寫一函式，實現兩個字串的比較。即自己寫一個strcmp函式,函式原型為int strcmp(char * p1 ,char * p2); 設p1指向字串s1, p2指向字串s2。要求當s1=s2時,返回值為0;若s1≠s2,返回它們二者第1個不同字元的ASCII碼差值(如"BOY"與"BAD"

寫一函式，實現兩個字串的比較。即自己寫一個strcmp函式,函式原型為int strcmp(char * p1 ,char * p2); 設p1指向字串s1, p2指向字串s2。要求當s1=s2時,返回值為0;若s1≠s2,返回它們二者第1個不同字元的ASCII碼差值(如

編寫一個程式，將連個字串s1和s2比較，如果s1 > s2，輸出一個整數；若s1 = s2，輸出0；若s1 < s2，輸出一個負數。不要用strcpy函式。兩個字串用gets函式讀入。輸出的正數或負數的絕對值應是相比較的兩個字串相對應字元的ASCII碼的差值。例如，"A"和“C”相比，由於"A" < "C"，應輸出

編寫一個程式，將連個字串s1和s2比較，如果s1 > s2，輸出一個整數；若s1 = s2，輸出0；若s1 < s2，輸出一個負數。不要用strcpy函式。兩個字串用gets函式讀入。輸出的正數或負數的絕對值應是相比較的兩個字串相

java中char對應的ASCII碼的轉化操作

java中，char型別變數可以強制轉化為int型別變數，int型別變數也可以強制轉化成char型別的變數：

JAVA實現列印ascii碼錶程式碼

我就廢話不多說了，大家還是直接看程式碼吧~ package com.jalor; public class AAAA { public static void main(String[] args) {

java讀取檔案:char的ASCII碼值=65279,顯示是一個空字元的解決

java讀取檔案遇到個很神奇的問題，String str1 = \"1\"; String str2 = \"1\"; str1 .equals(str1 ) 返回值是false。且他們的長度是不一樣的。

java的轉義字元之製表符，字元與ASCII碼轉換

public class Main{ public static void main(String[] args){ Person person = new Person(); String[] name = {"wang","tiantian"};

用正則怎麼將html檔案中文字取出進行ASCII碼轉換？

用正則怎麼將html檔案中文字取出？今天碰到這個問題，思來想去嘗試了好幾種方法，歷經一陣頭腦風暴，最後終於還是解決了，想想還是來記錄一下。一共定義了三個函式，包含正則切割、正則判斷物件開頭、ASCII碼編碼、A

ASCII碼格式轉回漢字

技術標籤：LinuxjavaWeb 通常在properties檔案中配置中文的屬性時，需要將中文轉換成ASCII碼格式，

ascii碼_C語言到底使用什麼編碼？誰說C語言使用ASCII碼，真是荒謬！

技術標籤：ascii碼c語言unicodec語言中文網c語言計算程式執行時間delphi 中文轉 ascii編碼gbk編碼線上轉換

Java 基礎(ASCII 碼，Unicode 編碼，UTF-8, 二進位制)

ASCCII 碼在計算機內部，所有資料都使用二進位制表示。每一個二進位制位(bit）有0和1兩種狀態,因此8個二進位制位就可以組合出256種狀態，這被稱為一個位元組(byte)。一個位元組一共可以用來表示256種不同的狀態，每

無符號字元型與擴充套件ASCII碼錶

In C++ we have seen there is character type data called char. Sometimes we have seen unsigned char also. So here we will see what is basically the unsigned char means. What are the basic differences b