php獲取中文漢字拼音首字母
阿新 • • 發佈:2020-08-20
背景
專案開發中三級地區需要根據名稱拼音首字母進行分組展示,但是地區表中名稱拼音首字母不全,因此需要根據地區名稱獲取其拼音首字母。
坑
搜尋了一圈發現絕大部分的解決方案都是一樣的程式碼,核心就是下面的這個函式
function getFirstCharter($str) { if (empty($str)) { return ''; } $fchar = ord($str{0}); if ($fchar >= ord('A') && $fchar <= ord('z')) return strtoupper($str{0}); $s1 = iconv('UTF-8', 'gb2312', $str); $s2 = iconv('gb2312', 'UTF-8', $s1); $s = $s2 == $str ? $s1 : $str; $asc = ord($s{0}) * 256 + ord($s{1}) - 65536; if ($asc >= -20319 && $asc <= -20284) return 'A'; if ($asc >= -20283 && $asc <= -19776) return 'B'; if ($asc >= -19775 && $asc <= -19219) return 'C'; if ($asc >= -19218 && $asc <= -18711) return 'D'; if ($asc >= -18710 && $asc <= -18527) return 'E'; if ($asc >= -18526 && $asc <= -18240) return 'F'; if ($asc >= -18239 && $asc <= -17923) return 'G'; if ($asc >= -17922 && $asc <= -17418) return 'H'; if ($asc >= -17417 && $asc <= -16475) return 'J'; if ($asc >= -16474 && $asc <= -16213) return 'K'; if ($asc >= -16212 && $asc <= -15641) return 'L'; if ($asc >= -15640 && $asc <= -15166) return 'M'; if ($asc >= -15165 && $asc <= -14923) return 'N'; if ($asc >= -14922 && $asc <= -14915) return 'O'; if ($asc >= -14914 && $asc <= -14631) return 'P'; if ($asc >= -14630 && $asc <= -14150) return 'Q'; if ($asc >= -14149 && $asc <= -14091) return 'R'; if ($asc >= -14090 && $asc <= -13319) return 'S'; if ($asc >= -13318 && $asc <= -12839) return 'T'; if ($asc >= -12838 && $asc <= -12557) return 'W'; if ($asc >= -12556 && $asc <= -11848) return 'X'; if ($asc >= -11847 && $asc <= -11056) return 'Y'; if ($asc >= -11055 && $asc <= -10247) return 'Z'; return null; }
但是這種實現方式由於GB2312標準共收錄6763個漢字,很多字上面這種方式都無法正確獲取其拼音首字母。
正確的實現方式
使用overtrue/pinyin包。
use Overtrue\Pinyin\Pinyin;
$areaName = '河南';
$pinyin = new Pinyin();
$s = mb_substr(areaName, 0, 1, 'utf-8');
$firstChar = strtoupper($pinyin->abbr($s));
var_dump(firstChar);
overtrue/pinyin
上面的程式碼只是其很小的一部分應用,其還有很多用法,具體可以檢視該專案的github: https://github.com/overtrue/pinyin
use Overtrue\Pinyin\Pinyin; // 小記憶體型 $pinyin = new Pinyin(); // 預設 // 記憶體型 // $pinyin = new Pinyin('\\Overtrue\\Pinyin\\MemoryFileDictLoader'); // I/O型 // $pinyin = new Pinyin('\\Overtrue\\Pinyin\\GeneratorFileDictLoader'); $pinyin->convert('帶著希望去旅行,比到達終點更美好'); // ["dai", "zhe", "xi", "wang", "qu", "lyu", "xing", "bi", "dao", "da", "zhong", "dian", "geng", "mei", "hao"] // PINYIN_TONE: UNICODE 式音調 $pinyin->convert('帶著希望去旅行,比到達終點更美好', PINYIN_TONE); // ["dài","zhe","xī","wàng","qù","lǚ","xíng","bǐ","dào","dá","zhōng","diǎn","gèng","měi","hǎo"] //PINYIN_ASCII_TONE 帶數字式音調 $pinyin->convert('帶著希望去旅行,比到達終點更美好', PINYIN_ASCII_TONE); //["dai4","zhe","xi1","wang4","qu4","lyu3","xing2","bi3","dao4","da2","zhong1","dian3","geng4","mei3","hao3"]