opencc 繁體簡體互轉 (C++示例)
阿新 • • 發佈:2017-08-01
big5 hub argv 實現 return using utf stream bsp 繁體字通常采用BIG5編碼,簡體字通常采用GBK或者GB18030編碼,這種情況下,直接使用iconv(linux下有對應的命令,也有對應的C API供編程調用)就行。對於默認采用utf-8編碼的文件或者繁簡體都並存的情況(通常采用utf-8)編碼的情況,iconv這種方式就不行了。這裏我們可以采用一個調用 opencc 的開源庫,來實現UTF-8編碼環境下的簡體、繁體互轉的功能。參照 https://github.com/BYVoid/OpenCC 完成opencc庫的安裝
下面是自己用C++程序調用相關的API來完成的繁體轉簡體的功能
//test.cpp #include <iostream> #include <opencc/opencc.h> using namespace std; int main ( int argc, char *argv[] ) { string str= "中華人民共和國反分裂國家法"; //string str= "中華人民共和國反分裂國家法"; //默認的是簡體轉繁體即OPENCC_DEFAULT_CONFIG_TRAD_TO_SIMP, opencc.h頭文件中有詳細介紹 opencc_t ot = opencc_open(OPENCC_DEFAULT_CONFIG_TRAD_TO_SIMP); char buffer[512] = {‘\0‘}; opencc_convert_utf8_to_buffer(ot, str.c_str(), str.size(), buffer); cout << "result is " << buffer << endl; opencc_close(ot); return 0; }
編譯 g++ test.cpp -o test -lopencc
opencc 繁體簡體互轉 (C++示例)