1. 程式人生 > >關於對php中使用set names utf8語句的理解

關於對php中使用set names utf8語句的理解

解決亂碼的方法,我們經常使用“set names utf8”,那麼為什麼加上這句程式碼就可以解決了呢?下面跟著我一起來深入set names utf8的內部執行原理

先說MySQL的字符集問題。Windows下可通過修改my.ini內的

PHP程式碼

[mysql

default-character-set=utf8    //客戶端的預設字符集
[mysqld]

default-character-set=utf8    //伺服器端預設的字符集

假設我們把兩個都設為utf8,然後在MySQL Command Line Client裡面輸入“show variables like“character_set_%”;”,可看到如下字元:
character_set_client   latin1
character_set_connection    latin1
character_set_database     utf8
character_set_results    latin1
character_set_server   utf8
character_set_system     utf8
要是我們通過採用UTF-8的

PHP程式從資料庫裡讀取資料,很有可能是一串“?????”或者是其他亂碼。

解決辦法是,在連線資料庫之後,讀取資料之前,先執行一項查詢“SET NAMES UTF8”,即在php裡為

mysql_query("SET NAMES UTF8");   

//該句話一定要放在資料庫伺服器連線語句【$connection=mysql_connect($db_host,$db_user,$db_psw)or die("連線伺服器失敗");】之後

即可顯示正常(只要資料庫裡資訊的字元正常)。

到MySQL命令列輸入“SET NAMES UTF8;”,然後執行“show variebles like“character_set_%”;”,發現原來為latin1的那些變數“character_set_client”、“character_set_connection”、“character_set_results”的值全部變為utf8了,原來是這3個變數在搗蛋。

查閱手冊,上面那句等於:

SET character_set_client = utf8;     

SET character_set_results = utf8;    

SET character_set_connection = utf8; 

看看這3個變數的作用:
資訊輸入路徑:client→connection→server;
資訊輸出路徑:server→connection→results。
換句話說,每個路徑要經過3次改變字符集編碼。以出現亂碼的輸出為例,server裡utf8的資料,傳入connection轉為latin1,傳入results轉為latin1,utf-8頁面又把results轉過來。如果兩種字符集不相容,比如latin1和utf8,轉化過程就為不可逆的,破壞性的。

但這裡要宣告一點,“SET NAMES UTF8”作用只是臨時的,MySQL重啟後就恢復默認了。

接下來就說到MySQL在伺服器上的配置問題了。豈不是我們每次對資料庫讀寫都得加上“SET NAMESUTF8”,以保證資料傳輸的編碼一致?能不能通過配置MySQL來達到那三個變數預設就為我們要想的字符集?手冊上沒說,我在網上也沒找到答案。所以,從伺服器配置的角度而言,是沒辦法省略掉那行程式碼的。
總結:為了讓你的網頁能在更多的伺服器上正常地顯示,還是加上“SET NAMES UTF8”吧,即使你現在沒有加上這句也能正常訪問。

注:根據以上文章,本人理解為,也就是說,mysql中修改了預設的編碼格式,可以使得server即資料庫中的資料編碼格式為utf8但是無法保證connection中和results中的編碼格式也為utf8因此需要加上set names utf8來使得三個地方的編碼格式都統一為utf8