Linux中通過locale來設定字符集
/********************************************************************************************************************
轉載原因:在學習shell指令碼時,用[a-z]和[A-Z]來判斷大小寫時,結果會不對,原來是可能是Linux發行版中的字符集排列的問題。用到了:LC_COLLATE。
*********************************************************************************************************************/
在Linux中通過locale來設定程式執行的不同語言環境,locale由ANSI C提供支援。locale的命名規則為<語言>_<地區>.<字符集編碼>,如zh_CN.UTF-8,zh代表中文,CN代表大陸地區,UTF-8表示字符集。在locale環境中,有一組變數,代表國際化環境中的不同設定:
1. LC_COLLATE
定義該環境的排序和比較規則
2. LC_CTYPE
用於字元分類和字串處理,控制所有字元的處理方式,包括字元編碼,字元是單位元組還是多位元組,如何列印等。是最重要的一個環境變數。
3. LC_MONETARY
貨幣格式
4. LC_NUMERIC
非貨幣的數字顯示格式
5. LC_TIME
時間和日期格式
6. LC_MESSAGES
提示資訊的語言。另外還有一個LANGUAGE引數,它與LC_MESSAGES相似,但如果該引數一旦設定,則LC_MESSAGES引數就會失效。LANGUAGE引數可同時設定多種語言資訊,如LANGUANE="zh_CN.GB18030:zh_CN.GB2312:zh_CN"。
7. LANG
LC_*的預設值,是最低級別的設定,如果LC_*沒有設定,則使用該值。類似於 LC_ALL。
8. LC_ALL
它是一個巨集,如果該值設定了,則該值會覆蓋所有LC_*的設定值。注意,LANG的值不受該巨集影響。
一個例子:
設定前,使用預設locale: debian:~# locale LANG="POSIX" LC_CTYPE="POSIX" LC_NUMERIC="POSIX" LC_TIME="POSIX" LC_COLLATE="POSIX" LC_MONETARY="POSIX" LC_MESSAGES="POSIX" LC_PAPER="POSIX" LC_NAME="POSIX" LC_ADDRESS="POSIX" LC_TELEPHONE="POSIX" LC_MEASUREMENT="POSIX" LC_IDENTIFICATION="POSIX" LC_ALL=
設定後,使用zh_CN.GDK中文locale:
debian:~# export LC_ALL=zh_CN.GBK debian:~# locale LANG=zh_CN.UTF-8 LC_CTYPE="zh_CN.GBK" LC_NUMERIC="zh_CN.GBK" LC_TIME="zh_CN.GBK" LC_COLLATE="zh_CN.GBK" LC_MONETARY="zh_CN.GBK" LC_MESSAGES="zh_CN.GBK" LC_PAPER="zh_CN.GBK" LC_NAME="zh_CN.GBK" LC_ADDRESS="zh_CN.GBK" LC_TELEPHONE="zh_CN.GBK" LC_MEASUREMENT="zh_CN.GBK" LC_IDENTIFICATION="zh_CN.GBK" LC_ALL=zh_CN.GBK
"C"是系統預設的locale,"POSIX"是"C"的別名。所以當我們新安裝完一個系統時,預設的locale就是C或POSIX。
在Debian中安裝locales的方法如下:
· 通過apt-get install locales命令安裝locales包
· 安裝完成locales包後,系統會自動進行locale配置,你只要選擇所需的locale,可以多選。最後指定一個系統預設的locale。這樣系統就會幫你自動生成相應的locale和配置好系統的locale。
· 增加新的locale也很簡單,用dpkp-reconfigure locales重新配置locale即可。
· 我們也可手動增加locale,只要把新的locale增加到/etc/locale.gen檔案中,再執行locale-gen命令即可生成新的locale。再通過設定上面介紹的LC_*變數就可設定系統的locale了。下是一個locale.gen檔案的樣例。
· # This file lists locales that you wish to have built. You can find a list · # of valid supported locales at /usr/share/i18n/SUPPORTED. Other · # combinations are possible, but may not be well tested. If you change · # this file, you need to rerun locale-gen. · # ·zh_CN.GBK GBK ·zh_CN.UTF-8 UTF-8