1. 程式人生 > >wc命令中字節,字符的計算方式

wc命令中字節,字符的計算方式

wc 基本命令

wc命令輸出的是行數字數和字節數,字節數是byte,是用於計量存儲的一種單位,常見的計量單位包括Kb,Mb,Gb,字符和字節換算還要看是什麽編碼,常見的有ascii碼,utf-8編碼和unicode編碼,編碼不同,換算不同。

ASCII碼:一個英文字母占一個字節的空間,一個中文漢字占兩個字節的空間。

UTF-8編碼:一個英文字符等於一個字節,一個中文等於三個字節。

Unicode編碼:一個英文等於兩個字節,一個中文(含繁體)等於兩個字節。

符號:英文標點占一個字節,中文標點占兩個字節。


[root@centos7 ~]#echo $LANG
en_US.UTF-8
#顯示當前用的什麽語系和編碼,英文UTF-8編碼,1個英文字符等於1個字節,1個中文等於3個字節,註意空格是1個字符,每一行還有1個換行符

[root@centos7 ~]#cat test1
你好 cn

[root@centos7 ~]#wc test1
 1  2 10 test1
 #test1是1行,2個字,字節數是3(中文)+3(中文)+1(空格)+2(英文)+1(換行符)=10

[root@centos7 ~]#cat test2
123456nihao
123456nihao

[root@centos7 ~]#wc test2
 2  2 24 test2
 #test2是2行,2個字,字節數是11+1(換行符)+11+1(換行符)=24

wc命令中字節,字符的計算方式