1. 程式人生 > >opencc 繁體簡體互轉 (C++示例)

opencc 繁體簡體互轉 (C++示例)

big5 hub argv 實現 return using utf stream bsp

繁體字通常采用BIG5編碼,簡體字通常采用GBK或者GB18030編碼,這種情況下,直接使用iconv(linux下有對應的命令,也有對應的C API供編程調用)就行。對於默認采用utf-8編碼的文件或者繁簡體都並存的情況(通常采用utf-8)編碼的情況,iconv這種方式就不行了。這裏我們可以采用一個調用 opencc 的開源庫,來實現UTF-8編碼環境下的簡體、繁體互轉的功能。參照 https://github.com/BYVoid/OpenCC 完成opencc庫的安裝 下面是自己用C++程序調用相關的API來完成的繁體轉簡體的功能
//test.cpp
 
#include <iostream>
#include <opencc/opencc.h>
 
using namespace std;
 
int main ( int argc, char *argv[] )
{
    string str= "中華人民共和國反分裂國家法";
    //string str= "中華人民共和國反分裂國家法";
 
    //默認的是簡體轉繁體即OPENCC_DEFAULT_CONFIG_TRAD_TO_SIMP, opencc.h頭文件中有詳細介紹
    opencc_t ot = opencc_open(OPENCC_DEFAULT_CONFIG_TRAD_TO_SIMP);
 
    char buffer[512] = {‘\0‘};
    opencc_convert_utf8_to_buffer(ot, str.c_str(), str.size(), buffer);
    cout << "result is " << buffer << endl;
 
    opencc_close(ot);
 
    return 0;
}

編譯 g++ test.cpp -o test -lopencc

opencc 繁體簡體互轉 (C++示例)