wc命令中字節,字符的計算方式
阿新 • • 發佈:2018-03-19
wc 基本命令 wc命令輸出的是行數字數和字節數,字節數是byte,是用於計量存儲的一種單位,常見的計量單位包括Kb,Mb,Gb,字符和字節換算還要看是什麽編碼,常見的有ascii碼,utf-8編碼和unicode編碼,編碼不同,換算不同。
ASCII碼:一個英文字母占一個字節的空間,一個中文漢字占兩個字節的空間。
UTF-8編碼:一個英文字符等於一個字節,一個中文等於三個字節。
Unicode編碼:一個英文等於兩個字節,一個中文(含繁體)等於兩個字節。
符號:英文標點占一個字節,中文標點占兩個字節。
[root@centos7 ~]#echo $LANG en_US.UTF-8 #顯示當前用的什麽語系和編碼,英文UTF-8編碼,1個英文字符等於1個字節,1個中文等於3個字節,註意空格是1個字符,每一行還有1個換行符 [root@centos7 ~]#cat test1 你好 cn [root@centos7 ~]#wc test1 1 2 10 test1 #test1是1行,2個字,字節數是3(中文)+3(中文)+1(空格)+2(英文)+1(換行符)=10 [root@centos7 ~]#cat test2 123456nihao 123456nihao [root@centos7 ~]#wc test2 2 2 24 test2 #test2是2行,2個字,字節數是11+1(換行符)+11+1(換行符)=24
wc命令中字節,字符的計算方式