GBK編碼PHP指令碼導致語法錯誤(Zend Multibyte)
阿新 • • 發佈:2018-12-23
微薄上有同學問我:
GBK環境下如下php程式碼:<?php echo("洪仁玕");?> 會引發php的語法錯誤,如何解決?
這個是因為, 在GBK環境下, “玕”的編碼是”0xab 0x5c, 所以, 又是一個’5c’引發的問題..
一般來說, 還是建議大家用unicode作為程式碼檔案的字符集, 如果要使用GBK, 再主動轉換下.
不過, 就問題說問題, 如果你的指令碼非要GBK編碼, 那怎麼避免這個問題呢?
從PHP5.3開始, PHP引入了Zend Multibyte來支援多字符集編碼. 對於上面的程式碼, 我們修改如下:
<?php declare(encoding="cp936"); echo("洪仁玕"); ?>
然後, 在php.ini中配置:
mbstring.internal_encoding=cp936
或者通過如下命令執行PHP:
$php -dmbstring.internal_encoding=cp936 test.php
PS, 我在試驗PHP5.4 RC1的時候, 發現了一個BUG, PHP 5.4 不能正確的轉換GBK編碼到UTF8編碼, 不過現在我已經修復. 大家如果遇到這個問題, 請關注馬上要釋出的PHP5.4 RC2即可.. 謝謝