1. 程式人生 > >GBK編碼PHP指令碼導致語法錯誤(Zend Multibyte)

GBK編碼PHP指令碼導致語法錯誤(Zend Multibyte)

微薄上有同學問我:

     GBK環境下如下php程式碼:<?php echo("洪仁玕");?> 會引發php的語法錯誤,如何解決?

這個是因為, 在GBK環境下, “玕”的編碼是”0xab 0x5c, 所以, 又是一個’5c’引發的問題..

一般來說, 還是建議大家用unicode作為程式碼檔案的字符集, 如果要使用GBK, 再主動轉換下.

不過, 就問題說問題, 如果你的指令碼非要GBK編碼, 那怎麼避免這個問題呢?

從PHP5.3開始, PHP引入了Zend Multibyte來支援多字符集編碼. 對於上面的程式碼, 我們修改如下:

<?php
declare(encoding="cp936");
echo("洪仁玕");
?>

然後, 在php.ini中配置:

mbstring.internal_encoding=cp936

或者通過如下命令執行PHP:

$php  -dmbstring.internal_encoding=cp936 test.php

PS, 我在試驗PHP5.4 RC1的時候, 發現了一個BUG, PHP 5.4 不能正確的轉換GBK編碼到UTF8編碼, 不過現在我已經修復. 大家如果遇到這個問題, 請關注馬上要釋出的PHP5.4 RC2即可.. 謝謝