1. 程式人生 > >EditPlus註冊碼線上生成,刪除utf-8BOM,完美解決php檔案亂碼問題

EditPlus註冊碼線上生成,刪除utf-8BOM,完美解決php檔案亂碼問題

http://www.jb51.net/tools/editplus/

EditPlus註冊碼線上生成,是由demon.tw部落格轉載過來,非常不錯,分享給大家,再次感謝demon.tw博主。大家先隨便輸入一個使用者名稱,點選後面生成即可看到,與你使用者名稱對應的註冊碼。

字元編碼相關資訊  http://baike.baidu.com/view/1204863.htm

UTF-8 編碼的檔案可以分為no BOM 和 BOM兩種格式。

有bom頭的儲存或者位元組流,它一定是unicode字符集編碼。到底屬於那一種(utf-8還是utf-16或是utf-32),通過頭可以判斷出來。

在utf-8編碼檔案中BOM在檔案頭部,佔用三個位元組,用來標示該檔案屬於utf-8編碼

UTF-8的BOM是 EFBBBF,因為UE載入UTF-8檔案會轉成Utf16,上述的EFBBBF 在Utf16中是FFFE(Unicode-LE的BOM)

1、editplus去BOM頭的方法

編輯器調整為UTF8編碼格式後,儲存的檔案前面會多出一串隱藏的字元(也即是BOM),用於編輯器識別這個檔案是否是以UTF8編碼。 執行Editplus,點選工具,選擇首選項,選中檔案,UTF-8標識選擇 總是刪除簽名,

然後對PHP檔案編輯和儲存後的PHP檔案就是不帶BOM的了。

2、ultraedit去除bom頭辦法

開啟檔案後,另存為選項的編碼格式裡選擇(utf-8 無bom頭),確定就ok了

utf without BOM轉換成utf-8 BOM的批量處理工具

ultracodingswitch下載地址:http://www.duote.com/soft/12486.html

一.HTML頁面轉UTF-8編碼問題
1.在head後,title前加入一行:

<meta http-equiv='Content-Type' content='text/html; charset=utf-8' />
順序不能錯,一定要在

顯示的標題有可能是亂碼!

2.html檔案編碼問題:

點選編輯器的選單:“檔案”->“另存為”,可以看到當前檔案的編碼,確保檔案編碼為:UTF-8,
如果是ANSI,需要將編碼改成:UTF-8。
3.HTML檔案頭BOM問題:
將檔案從其他的編碼轉換成UTF-8編碼時,有時候會在檔案的最開始加上一個BOM標籤,
在個BOM標籤可能會導致瀏覽器在顯示中文的時候出現亂碼。
刪除這個BOM標籤的方法:
1.可以用Dreamweaver開啟檔案,並重新儲存,即可以去除BOM標籤!
2.可以用EditPlus開啟檔案,並在選單“首選項”->“檔案”->"UTF-8標識",設定為:“總是刪除簽名”,
然後儲存檔案,即可以去除BOM標籤!
4.WEB伺服器UTF-8編碼問題:
如果你按以上所列的步驟做了,還是有中文亂碼問題,
請檢查你的所使用的WEB伺服器的編碼問題
如果你使用的是Apache,請將配置檔案裡的:charset 設成:utf-8(這裡僅列出方法,具體格式請參考apache的配置檔案)
如果你使用的是Nginx,請將nginx.conf裡的:charset 設成 utf-8,
具體找到 "charset gb2312;"或者類似的語句,改成:“charset utf-8;”。
二.PHP頁面轉UTF-8編碼問題

1.在程式碼開始出加入一行:
header("Content-Type: text/html;charset=utf-8");

2.PHP檔案編碼問題

點選編輯器的選單:“檔案”->“另存為”,可以看到當前檔案的編碼,確保檔案編碼為:UTF-8,
如果是ANSI,需要將編碼改成:UTF-8。
3.PHP檔案頭BOM問題:
PHP檔案一定不可以有BOM標籤
否則,會出現session不能使用的情況,並有類似的提示:
Warning: session_start() [function.session-start]: Cannot send session cache limiter - headers already sent
這是因為,在執行session_start() 的時候,整個頁面不能有輸出,但是當由於前PHP頁面存在BOM標籤,
PHP把這個BOM標籤當成是輸出了,所以就出錯了!
所以PHP頁面一定要刪除BOM標籤
刪除這個BOM標籤的方法:
1.可以用Dreamweaver開啟檔案,並重新儲存,即可以去除BOM標籤!
2.可以用EditPlus開啟檔案,並在選單“首選項”->“檔案”->"UTF-8標識",設定為:“總是刪除簽名”,
然後儲存檔案,即可以去除BOM標籤!
4.PHP以附件形式儲存檔案的時候,UTF-8編碼問題:
PHP以附件形式儲存檔案,檔名必須是GB2312編碼,
否則,如果檔名中有中文的話,將是顯示亂碼:
如果你的PHP本身是UTF-8編碼格式的檔案,
需要將檔名變數由UTF-8轉成GB2312:
iconv("UTF-8", "GB2312", "$filename");

5.截斷顯示文章標題時,出現亂碼或者“?”問號的問題:
一般文章標題很長的時候,會顯示一部分標題,會對文章標題進行截斷,
由於一個UTF-8編碼格式的中文字元會佔用3個字元寬度,
擷取標題的時候,有時會只擷取到一箇中文字元的1個字元或2字元寬度,
沒擷取完整,將出現亂碼或“?”問號的情況,
用下面的函式擷取標題,就不會有問題:

複製程式碼 程式碼如下:
function get_brief_str($str, $max_length)
{
echo strlen($str) ."<br>";
if(strlen($str) > $max_length)
{
$check_num = 0;
for($i=0; $i < $max_length; $i++)
{
if (ord($str[$i]) > 128)
$check_num++;
}

if($check_num % 3 == 0)
$str = substr($str, 0, $max_length)."...";
else if($check_num % 3 == 1)
$str = substr($str, 0, $max_length + 2)."...";
else if($check_num % 3 == 2)
$str = substr($str, 0, $max_length + 1)."...";
}
return $str;
}

三.MYSQL資料庫使用UTF-8編碼的問題

1.用phpmyadmin建立資料庫和資料表
建立資料庫的時候,請將“整理”設定為:“utf8_general_ci”
或執行語句:

CREATE DATABASE `dbname` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
建立資料表的時候:如果是該欄位是存放中文的話,則需要將“整理”設定為:“utf8_general_ci”,

如果該欄位是存放英文或數字的話,預設就可以了。

相應的SQL語句,例如:
複製程式碼 程式碼如下:
CREATE TABLE `test` (
`id` INT NOT NULL ,
`name` VARCHAR( 10 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,
PRIMARY KEY ( `id` )
) ENGINE = MYISAM ;

2.用PHP讀寫資料庫

在連線資料庫之後:

[hide]$connection = mysql_connect($host_name, $host_user, $host_pass);

加入兩行:
複製程式碼 程式碼如下:
mysql_query("set character set 'utf8'");//讀庫
mysql_query("set names 'utf8'");//寫庫

就可以正常的讀寫MYSQL資料庫了。

四.JS相關的UTF-8編碼問題
1.JS讀Cookie的中文亂碼問題

PHP寫cookie的時候需要將中文字元進行escape編碼,
否則JS讀到cookie中的中文字元將是亂碼。
但php本身沒有escape函式,我們新寫一個escape函式:
複製程式碼 程式碼如下:
function escape($str)
{
preg_match_all("/[\x80-\xff].|[\x01-\x7f]+/",$str,$r);
$ar = $r[0];
foreach($ar as $k=>$v)
{
if(ord($v[0]) < 128)
$ar[$k] = rawurlencode($v);
else
$ar[$k] = "%u".bin2hex(iconv("UTF-8","UCS-2",$v));
}
return join("",$ar);
}

JS讀cookie的時候,用unescape解碼,

然後就解決cookie中有中文亂碼的問題了。

2.外部JS檔案UTF-8編碼問題

當一個HTML頁面或則PHP頁面包含一個外部的JS檔案時,

如果HTML頁面或則PHP頁面是UTF-8編碼格式的檔案,

外部的JS檔案同樣要轉成UTF-8的檔案,

否則將出現,沒有包含不成功,呼叫函式時沒有反應的情況。

點選編輯器的選單:“檔案”->“另存為”,可以看到當前檔案的編碼,確保檔案編碼為:UTF-8,

如果是ANSI,需要將編碼改成:UTF-8。

五.FLASH相關的UTF-8編碼問題

FLASH內部對所有字串,預設都是以UTF-8處理
1.FLASH讀文普通本檔案(txt,html)
要將文字檔案的編碼存為UTF-8
點選編輯器的選單:“檔案”->“另存為”,可以看到當前檔案的編碼,確保檔案編碼為:UTF-8,
如果是ANSI,需要將編碼改成:UTF-8。
2.FLASH讀XML檔案
要將XML檔案的編碼存為UTF-8
點選編輯器的選單:“檔案”->“另存為”,可以看到當前檔案的編碼,確保檔案編碼為:UTF-8,
如果是ANSI,需要將編碼改成:UTF-8。
在XML第1行寫:

3.FLASH讀PHP返回資料
如果PHP編碼本身是UTF-8的,直接echo就可以了
如果PHP編碼本身是GB2312的,可以將PHP轉存成UTF-8編碼格式的檔案,直接echo就可以了
如果PHP編碼本身是GB2312的,而且不允許改檔案的編碼格式,
用下面的語句將字串轉換成UTF-8的編碼格式
$new_str = iconv("GB2312", "UTF-8", "$str");
再echo就可以了
4.FLASH讀資料庫(MYSQL)的資料
FLASH要通過PHP讀取資料庫中的資料
PHP本身的編碼不重要,關鍵是如果資料庫的編碼是GB2312的話,
需要用下面的語句將字串轉換成UTF-8的編碼格式
$new_str = iconv("GB2312", "UTF-8", "$str");

5.FLASH通過PHP寫資料
一句話,FLASH傳過來的字串是UTF-8格式的,
要轉換成相應的編碼格式,再操作(寫檔案、寫資料庫、直接顯示等等)
還是用iconv函式轉換
6.FLASH使用本地編碼(理論上不推薦使用)
如果想讓FLASH不使用UTF-8編碼,而是使用本地編碼
對於中國大陸地區而言,本地編碼是GB2312或GBK
AS程式內,可以新增以下程式碼:
System.useCodepage = true;
那麼FLASH內所有字元都是使用GB2312的編碼了
所有匯入到FLASH或者從FLASH匯出的資料,都應該做相應的編碼轉換
因為使用本地編碼,會造成使用繁體中文地區的使用者產生亂碼,所以不推薦使用

http://www.jb51.net/article/30064.htm