Linux與Windows間的編碼
阿新 • • 發佈:2019-01-24
在 Debian Linux 中用 VirtualBox 虛擬了一個 Windows XP。但遺憾的是,Windows XP 的預設編碼格式是 GBK,而我的 Linux 編碼格式是 UTF-8。這就給兩者的中文操作形成困擾。不過VIM編輯器可以很平滑地解決這個問題,具體做法是在Windows和Linux下分別設定兩者的VIM配置,設定如下:
A) Windows XP 下VIM配置:
vim C:\Program Files\vim\_vimrc
....
set fileencodings=cp936,utf-8,ucs-bom " VIM開啟檔案時,可以認識的檔案編碼
set encoding=utf-8 " VIM編輯檔案時,螢幕顯示檔案的編碼
set fileencoding=cp936 " VIM儲存檔案時,硬碟儲存檔案的編碼
...
B) Linux 下VIM設定:
vim ~/vimrc
...
set fileencodings=cp936,utf-8,ucs-bom
set encoding=utf-8
set fileencoding=utf-8
...
完成上述設定後,無論在Windows XP下,還是在Linux下,編輯檔案時都是UTF-8編碼。但儲存檔案的編碼不一樣,Windows XP 將檔案儲存成 cp936(GBK)編碼,但Linux將檔案儲存成UTF-8編碼。
""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""
一、檢視檔案編碼:
在Linux中檢視檔案編碼可以通過以下幾種方式,例如:在
Vim 中可以直接檢視檔案編碼
:set fileencoding
即可顯示檔案編碼格式。
二、檔案編碼轉換:
1). 如果你只是想檢視其它編碼格式的檔案或者想解決用Vim檢視檔案亂碼的問題,那麼你可以在~/.vimrc檔案中新增以下內容:
set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936
其中 encoding 是 vim 的預設顯示編碼格式,fileencodings 是 vim 開啟檔案時檢測的編碼格式,存在這種型別的編碼即轉換為utf-8編碼。這樣,就可以讓 vim 自動識別檔案編碼(可以自動識別UTF-8或者GBK編碼的檔案),其實就是依照 fileencodings 提供的編碼列表嘗試,如果沒有找到合適的編碼,就用latin-1(ASCII)編碼開啟。
2). 在Vim中直接進行轉換檔案編碼:
比如將一個檔案轉換成utf-8格式
:set fileencoding=utf-8
3). iconv 轉換:
iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如將一個UTF-8 編碼的檔案轉換成GBK編碼
iconv -f GBK -t UTF-8 file1 -o file2
A) Windows XP 下VIM配置:
vim C:\Program Files\vim\_vimrc
....
set fileencodings=cp936,utf-8,ucs-bom " VIM開啟檔案時,可以認識的檔案編碼
set encoding=utf-8 " VIM編輯檔案時,螢幕顯示檔案的編碼
set fileencoding=cp936 " VIM儲存檔案時,硬碟儲存檔案的編碼
...
B) Linux 下VIM設定:
vim ~/vimrc
...
set fileencodings=cp936,utf-8,ucs-bom
set encoding=utf-8
set fileencoding=utf-8
...
完成上述設定後,無論在Windows XP下,還是在Linux下,編輯檔案時都是UTF-8編碼。但儲存檔案的編碼不一樣,Windows XP 將檔案儲存成 cp936(GBK)編碼,但Linux將檔案儲存成UTF-8編碼。
""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""
一、檢視檔案編碼:
在Linux中檢視檔案編碼可以通過以下幾種方式,例如:在
:set fileencoding
即可顯示檔案編碼格式。
二、檔案編碼轉換:
1). 如果你只是想檢視其它編碼格式的檔案或者想解決用Vim檢視檔案亂碼的問題,那麼你可以在~/.vimrc檔案中新增以下內容:
set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936
其中 encoding 是 vim 的預設顯示編碼格式,fileencodings 是 vim 開啟檔案時檢測的編碼格式,存在這種型別的編碼即轉換為utf-8編碼。這樣,就可以讓 vim 自動識別檔案編碼(可以自動識別UTF-8或者GBK編碼的檔案),其實就是依照 fileencodings 提供的編碼列表嘗試,如果沒有找到合適的編碼,就用latin-1(ASCII)編碼開啟。
2). 在Vim中直接進行轉換檔案編碼:
比如將一個檔案轉換成utf-8格式
:set fileencoding=utf-8
3). iconv 轉換:
iconv的命令格式如下:
iconv -f encoding -t encoding inputfile
比如將一個UTF-8 編碼的檔案轉換成GBK編碼
iconv -f GBK -t UTF-8 file1 -o file2