vim中文亂碼 vim字符集設定

阿新 • • 發佈：2021-01-01

vim中文亂碼 vim字符集設定

vim的設定一般放在/etc/vimrc檔案中，不過，建議不要修改它。可以修改~/.vimrc檔案（預設不存在，可以自己新建一個），寫入所希望的設定。

set fileencodings=utf-8,ucs-bom,gb18030,gbk,gb2312,cp936
set termencoding=utf-8
set encoding=utf-8

vim編碼方面的基礎知識：

存在3個變數：
encoding—-該選項使用於緩衝的文字(你正在編輯的檔案)，暫存器，Vim 指令碼檔案等等。你可以把 'encoding' 選項當作是對 Vim 內部執行機制的設定。
fileencoding—-該選項是vim寫入檔案時採用的編碼型別。
termencoding—-該選項代表輸出到客戶終端（Term）採用的編碼型別。

此3個變數的預設值：
encoding—與系統當前locale相同，所以編輯檔案的時候要考慮當前locale，否則要設定的東西就比較多了。
fileencoding—vim開啟檔案時自動辨認其編碼，fileencoding就為辨認的值。如果fileencoding為空則儲存檔案時採用encoding的編碼，如果沒有修改encoding，那值就是系統當前locale了。
termencoding—預設空值，也就是輸出到終端時不進行編碼轉換。
由此可見，編輯不同編碼檔案需要注意的地方不僅僅是這3個變數，還有系統當前locale和檔案本身編碼以及自動編碼識別、客戶執行vim的終端所使用的編碼型別3個關鍵點，這3個關鍵點影響著3個變數的設定。
如果有人問：為什麼我用vim開啟中文文件的時候出現亂碼？
答案是不確定的，原因上面已經講了，不搞清楚這3個關鍵點和這3個變數的設定值，出現亂碼是正常的，若不出現亂碼那反倒是湊巧的。
再來看一下常見情況下這三個關鍵點的值以及在這種情況下這3個變數的值：

locale—目前大部分Linux系統已經將utf-8作為預設locale了，不過也有可能不是，例如有些系統使用中文locale zh_CN.GB18030。在locale為utf-8的情況下，啟動vim後encoding將會設定為utf-8，這是相容性最好的方式，因為內部處理使用utf-8的話，無論外部儲存編碼為何都可以進行無缺損轉換。locale決定了vim內部處理資料的編碼，也就是encoding。
檔案的編碼以及自動編碼識別—這方面牽扯到各種編碼的規則，就不一一細講了。但需要明白的是，檔案編碼型別並不是儲存在檔案內的，也就是說沒有任何描述性的欄位來記錄文件是何種編碼型別的。因此我們在編輯文件的時候，要麼必須知道文件儲存時是以什麼編碼儲存的，要麼通過另外的一些手段來斷定編碼型別，這另外的手段，就是通過某些編碼的碼錶特徵來斷定，例如每個字元佔用的位元組數，每個字元的ascii值是否都大於某個欄位來斷定這個檔案屬於何種編碼，這種方式vim也使用了，這就是vim的自動編碼識別機制了，但這種機制由於編碼各式各樣，不可能每種編碼都有顯著的特徵來辨別，所以是不可能 100%準確的。對於GB2312編碼，由於中文是使用了2個ASCII值高於127的字元組成漢字字元的，因此不可能把gb2312編碼的檔案與 latin1編碼區分開來，因此自動識別編碼的機制對於gb2312是失敗的，它只會將檔案辨識為latin1編碼。此問題同樣出現在gbk，big5上等，因此我們在編輯此類文件時，需要手工設定encoding和fileencoding。如果文件編碼為utf-8時，一般vim都能自動識別正確的編碼。

客戶執行vim的終端所使用的編碼型別(同第二條一樣，這也是一個比較難以斷定的關鍵點)。第二個關鍵點決定著從檔案讀取內容和寫入內容到檔案時使用的編碼，而此關鍵點則決定vim輸出內容到終端時使用的編碼，如果此編碼型別和終端認為它收到的資料的編碼型別不同，則又會產生亂碼問題。在 linux本地X環境下，一般終端都認為其接收的資料的編碼型別和系統locale型別相符，因此不需關心此方面是否存在問題。但如果牽涉到遠端終端，例如ssh登入伺服器，則問題就有可能出現了。例如從1臺locale為GB2310的終端（稱作客戶機）ssh到locale為utf-8的系統（稱作伺服器）並開啟vim編輯文件，在不加任何改動的情況下，伺服器返回的資料為utf-8的，但客戶機認為伺服器返回的資料是gb2312的，按照 gb2312來解釋資料，則肯定就是亂碼了，這時就需要設定termencoding為gb2312來解決這個問題，此問題更多出現在我們的 windows desktop機遠端ssh登入伺服器的情況下，這裡牽扯到不同系統的編碼轉換問題，所以又與windows本身以及ssh客戶端有很大相關性。在 windows下存在兩種編碼型別的軟體，一種是本身就為unicode編碼方式編寫的軟體，另一種是ANSI軟體，也就是程式處理資料直接採用位元組流，不關心編碼。前一種程式可以在任何語言的windows上正確顯示多國語言，而後一種則編寫在何種語言的系統上則只能在何種語言的系統上顯示正確的文字，對於這兩種型別的程式，我們需要區別對待。以ssh客戶端為例，我們使用的putty是unicode軟體，而secure CRT則是ANSI軟體。對於前者，我們要正確處理中文，只要保證vim輸出到終端的編碼為utf-8即可，就是termencoding=utf-8。但對於後者，一方面我們要確認我們的windows系統預設內碼表為cp936（中文windows預設值），另一方面要確認vim設定的termencoding= cp936。

vim中文亂碼 vim字符集設定

vim中文亂碼 vim字符集設定 vim的設定一般放在/etc/vimrc檔案中，不過，建議不要修改它。可以修改~/.vimrc檔案（預設不存在，可以自己新建一個），寫入所希望的設定。

linux -- 解決配置vim中文亂碼的問題

解決方案：解決linux下vim亂碼的情況：(修改vimrc的內容）全域性的情況下：即所有使用者都能用這個配置

vim編輯器中文亂碼修復

Vim是老式UNIX編輯器Vi的大幅改進版本。新增功能：多級撤消、語法高亮、命令列歷史記錄、線上幫助、拼寫檢查、檔名補全、塊操作、指令碼語言等。還有一個圖形使用者介面（GUI）可用。儘管如此，Vi 相容性仍然保持

jupyter 中文亂碼設定編碼格式避免控制檯輸出的解決

我就廢話不多說了，大家還是直接看程式碼吧！ stdi,stdo,stde = sys.stdin,sys.stdout,sys.stderr

Servlet在轉發中設定編碼失效，遇到中文亂碼？

技術標籤：JavaWeb亂碼servlet 看個例子：在servlet02中設定編碼，可以正常輸出顯示中文。

Sqoop報錯：Caused by: java.sql.BatchUpdateException: Incorrect string value: '\xF0\xA4\x8F\x81' 再見亂碼：5分鐘讀懂MySQL字符集設定

sqoop從hive匯出到mysql報錯如下： Caused by: java.sql.SQLException: Incorrect string value: \'\\xF0\\xA4\\x8F\\x81\' for column \'role_name\' at row 68

再見亂碼：5 分鐘讀懂 MySQL 字符集設定

作者：程式猿小卡_casper 原文：https://segmentfault.com/a/1190000012775484 一、內容概述

Sublime Text3 中文亂碼問題

導致亂碼的原因: Mac OS X 是基於Unix 系統開發的，預設使用 UTF-8 編碼。而Unix還有Linux預設是不支援ANSI (GBK)格式（ANSI也就是Windows系統下的預設中文簡體的編碼格式）和GB2312格式。同時Sublime Text的預設編碼

SpringMVC post請求中文亂碼問題解決

這篇文章主要介紹了SpringMVC post請求中文亂碼問題解決,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

執行vbs指令碼報錯無效字元、中文亂碼的解決方法(編碼問題)

程式碼沒有問題，總是報這樣的錯誤。測試程式碼 msgbox \"我們\" 很簡單的程式碼，但如果編碼不對問題就很多

mysql中插入表資料中文亂碼問題的解決方法

一、問題開發中遇到將其它資料庫資料插入到mysql資料庫表中一直會報類似如下錯誤：

解決Linux下Tomcat向MySQL插入資料中文亂碼問題

一、問題在windows上面使用eclipse開發的專案在windows上面執行一切正常，部署到騰訊雲時出現向MySQL資料庫中插入資料是中文亂碼

帶你5分鐘讀懂MySQL字符集設定

一、內容概述在MySQL的使用過程中，瞭解字符集、字元序的概念，以及不同設定對資料儲存、比較的影響非常重要。不少同學在日常工作中遇到的“亂碼”問題，很有可能就是因為對字符集與字元序的理解不到位、設定錯誤造

詳解mysql資料庫中文亂碼問題

當向 MySQL 資料庫插入一條帶有中文的資料形如insert into employee values(null,\'張三\',\'female\',\'1995-10-08\',\'2015-11-12\',\'Sales\',2000,\'是個好員工！\');出現亂碼時，可以使用語句show variables li