1. 程式人生 > >正則達式抓取所需資料

正則達式抓取所需資料

preg_match_all( [\x{4e00}-\x{9fa5}]*)/u', $str, $arr);

用此語句抓取文字中的中文字元時結果為亂碼, 原因是編碼問題引起, 在執行前需宣告編碼格式, header('content-type:text/html;charset=utf-8'), 並且要加修飾符u.    這樣一來似乎用 .* 也能正常得到中文字元.

注意匹配換行符 \n ,    回車符 \r.