txt中的換行符和sublime中的換行符
阿新 • • 發佈:2019-01-24
一個ANSI編碼的文字檔案,在txt編輯器中開啟,輸入一個Enter,用Hexeditor開啟後一看,發現多了兩個位元組,分別是\r和\n
如果用sublime編輯器裡開啟,輸入一個Enter,用Hexeditor開啟後可以發現,和上面是一樣的。
此外,對於ANSI編碼的檔案,檔案開頭是沒有特殊的標記字元的。
下面討論utf-8編碼的檔案。
檔案頭有EF BB BF標記這是一個utf-8編碼的檔案。
在txt編輯器中輸入Enter,用Hexeditor開啟後一看,發現多了兩個位元組,分別是\r和\n。
如果用sublime編輯器裡開啟,輸入一個Enter,用Hexeditor開啟後可以發現
unicode儲存:檔案開頭的標記:
如果強行把開頭的標記刪除,文中有中文的時候,在txt編輯器中進行任意編輯,檔案頭都會被自動加上EF BB BF的標記,以表示這是一個utf-8 編碼的檔案。
對於無標記的檔案,txt編輯器不可識別\n為換行符,但是sublime編輯器可以識別出這個換行符。
無開頭標識的情況下,使用sublime進行換行編輯,輸入的將是一個\n,而且更為奇怪的是,sublime還會把之前好好的\r\n替換成\n,這樣,整個檔案在txt編輯器看來,就只有一行了。