1. 程式人生 > >[PHP]解決rtrim產生亂碼的問題

[PHP]解決rtrim產生亂碼的問題

1、問題重現

$item = '3×魔力之源、300×10鑽石、300000×金幣、';

var_dump( rtrim('、', $item) );

string '3×魔力之源、300×10鑽石、300000×金��' (length=47)

2、原因

rtrim函式把引數都轉成了UTF8後再進行比較。

對於中文,一般都是先轉成Unicode,再根據下表轉成UTF8。

UCS-4(UNICODE)編碼 UTF-8位元組流
U-00000000 – U-0000007F 0xxxxxxx
U-00000080 – U-000007FF 110xxxxx 10xxxxxx
U-00000800 – U-0000FFFF 1110xxxx 10xxxxxx 10xxxxxx
U-00010000 – U-001FFFFF 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
U-00200000 – U-03FFFFFF 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
U-04000000 – U-7FFFFFFF 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

“幣”的Unicode為\u5e01,轉成二進位制101111000000001,轉成UTF8為11100101 10111000 10000001;
“、”的Unicode為\u3001,轉成二進位制  11000000000001,轉成UTF8為11100011 10000000 10000001;
rtrim是一個一個位元組過濾的,可見“幣”的UTF8最後變成了11100101 10111000,導致出現了亂碼。

3、解決方法

var_dump(mb_substr($item,0,-1,'utf-8'));

string '3×魔力之源、300×10鑽石、300000×金幣'