1. 程式人生 > 實用技巧 >php獲取中文漢字拼音首字母

php獲取中文漢字拼音首字母

背景

專案開發中三級地區需要根據名稱拼音首字母進行分組展示,但是地區表中名稱拼音首字母不全,因此需要根據地區名稱獲取其拼音首字母。

搜尋了一圈發現絕大部分的解決方案都是一樣的程式碼,核心就是下面的這個函式

function getFirstCharter($str)
    {
        if (empty($str)) {
            return '';
        }
        $fchar = ord($str{0});
        if ($fchar >= ord('A') && $fchar <= ord('z')) return strtoupper($str{0});
        $s1 = iconv('UTF-8', 'gb2312', $str);
        $s2 = iconv('gb2312', 'UTF-8', $s1);
        $s = $s2 == $str ? $s1 : $str;
        $asc = ord($s{0}) * 256 + ord($s{1}) - 65536;
        if ($asc >= -20319 && $asc <= -20284) return 'A';
        if ($asc >= -20283 && $asc <= -19776) return 'B';
        if ($asc >= -19775 && $asc <= -19219) return 'C';
        if ($asc >= -19218 && $asc <= -18711) return 'D';
        if ($asc >= -18710 && $asc <= -18527) return 'E';
        if ($asc >= -18526 && $asc <= -18240) return 'F';
        if ($asc >= -18239 && $asc <= -17923) return 'G';
        if ($asc >= -17922 && $asc <= -17418) return 'H';
        if ($asc >= -17417 && $asc <= -16475) return 'J';
        if ($asc >= -16474 && $asc <= -16213) return 'K';
        if ($asc >= -16212 && $asc <= -15641) return 'L';
        if ($asc >= -15640 && $asc <= -15166) return 'M';
        if ($asc >= -15165 && $asc <= -14923) return 'N';
        if ($asc >= -14922 && $asc <= -14915) return 'O';
        if ($asc >= -14914 && $asc <= -14631) return 'P';
        if ($asc >= -14630 && $asc <= -14150) return 'Q';
        if ($asc >= -14149 && $asc <= -14091) return 'R';
        if ($asc >= -14090 && $asc <= -13319) return 'S';
        if ($asc >= -13318 && $asc <= -12839) return 'T';
        if ($asc >= -12838 && $asc <= -12557) return 'W';
        if ($asc >= -12556 && $asc <= -11848) return 'X';
        if ($asc >= -11847 && $asc <= -11056) return 'Y';
        if ($asc >= -11055 && $asc <= -10247) return 'Z';
        return null;
    }

但是這種實現方式由於GB2312標準共收錄6763個漢字,很多字上面這種方式都無法正確獲取其拼音首字母。

正確的實現方式

使用overtrue/pinyin包。

use Overtrue\Pinyin\Pinyin;

$areaName = '河南';
$pinyin = new Pinyin();
$s = mb_substr(areaName, 0, 1, 'utf-8');
$firstChar = strtoupper($pinyin->abbr($s));
var_dump(firstChar);

overtrue/pinyin

上面的程式碼只是其很小的一部分應用,其還有很多用法,具體可以檢視該專案的github:

https://github.com/overtrue/pinyin

use Overtrue\Pinyin\Pinyin;

// 小記憶體型
$pinyin = new Pinyin(); // 預設
// 記憶體型
// $pinyin = new Pinyin('\\Overtrue\\Pinyin\\MemoryFileDictLoader');
// I/O型
// $pinyin = new Pinyin('\\Overtrue\\Pinyin\\GeneratorFileDictLoader');

$pinyin->convert('帶著希望去旅行,比到達終點更美好');
// ["dai", "zhe", "xi", "wang", "qu", "lyu", "xing", "bi", "dao", "da", "zhong", "dian", "geng", "mei", "hao"]

// PINYIN_TONE: UNICODE 式音調
$pinyin->convert('帶著希望去旅行,比到達終點更美好', PINYIN_TONE);
// ["dài","zhe","xī","wàng","qù","lǚ","xíng","bǐ","dào","dá","zhōng","diǎn","gèng","měi","hǎo"]

 //PINYIN_ASCII_TONE 帶數字式音調
$pinyin->convert('帶著希望去旅行,比到達終點更美好', PINYIN_ASCII_TONE);
//["dai4","zhe","xi1","wang4","qu4","lyu3","xing2","bi3","dao4","da2","zhong1","dian3","geng4","mei3","hao3"]

參考連結