1. 程式人生 > >Linux與Windows間的編碼

Linux與Windows間的編碼

在 Debian Linux 中用 VirtualBox 虛擬了一個 Windows XP。但遺憾的是,Windows XP 的預設編碼格式是 GBK,而我的 Linux 編碼格式是 UTF-8。這就給兩者的中文操作形成困擾。不過VIM編輯器可以很平滑地解決這個問題,具體做法是在Windows和Linux下分別設定兩者的VIM配置,設定如下:

A) Windows XP 下VIM配置:

vim  C:\Program Files\vim\_vimrc

....
set fileencodings=cp936,utf-8,ucs-bom      " VIM開啟檔案時,可以認識的檔案編碼
set encoding=utf-8                         " VIM編輯檔案時,螢幕顯示檔案的編碼
set fileencoding=cp936                     " VIM儲存檔案時,硬碟儲存檔案的編碼
...

B) Linux 下VIM設定:

vim ~/vimrc

...
set fileencodings=cp936,utf-8,ucs-bom
set encoding=utf-8
set fileencoding=utf-8
...

完成上述設定後,無論在Windows XP下,還是在Linux下,編輯檔案時都是UTF-8編碼。但儲存檔案的編碼不一樣,Windows XP 將檔案儲存成 cp936(GBK)編碼,但Linux將檔案儲存成UTF-8編碼。

""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""

一、檢視檔案編碼:

在Linux中檢視檔案編碼可以通過以下幾種方式,例如:在
Vim
中可以直接檢視檔案編碼

:set fileencoding

即可顯示檔案編碼格式。

二、檔案編碼轉換:

1). 如果你只是想檢視其它編碼格式的檔案或者想解決用Vim檢視檔案亂碼的問題,那麼你可以在~/.vimrc檔案中新增以下內容:

set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936

其中 encoding 是 vim 的預設顯示編碼格式,fileencodings 是 vim 開啟檔案時檢測的編碼格式,存在這種型別的編碼即轉換為utf-8編碼。這樣,就可以讓 vim 自動識別檔案編碼(可以自動識別UTF-8或者GBK編碼的檔案),其實就是依照 fileencodings 提供的編碼列表嘗試,如果沒有找到合適的編碼,就用latin-1(ASCII)編碼開啟。

2). 在Vim中直接進行轉換檔案編碼:

比如將一個檔案轉換成utf-8格式

:set fileencoding=utf-8

3). iconv 轉換:

iconv的命令格式如下:

iconv -f encoding -t encoding inputfile

比如將一個UTF-8 編碼的檔案轉換成GBK編碼

iconv -f GBK -t UTF-8 file1 -o file2