帶有漢字的字串截斷出現半個“漢字”的解決方法-C語言原始碼
漢字字元的編碼為雙位元組,對於漢字字元和單位元組字元混排的情況,如果目標擷取的字串內只包含奇數個單位元組字元,則會出現半個漢字字元的問題。如下所示:
(1)天水市秦州區南郭路2號(工行七裡墩分理處? --包含數字字元,單位元組。
(2)七里河區金港城金福花園20號樓3號(金港城?--包含數字字元,單位元組。
(3)甘肅銀馨春天餐飲服務業有限責任公司(省委? --包含英文格式半括號。
以上為擷取字串前四位以後的顯示結果,其中“?”為半個漢字編碼的顯示。要想解決以上問題可以採用擷取最後一個非法字元,並用合法字元替換的方法。例項程式碼如下所示:
#include <stdio.h>
int chkHalfChinese(char *buf,int len)
{
int i = 0;
int cnt = 0;
int idx;
for(i=0;i<len;i++)
{
int value = buf[i]&0xFF;
if(value>160)
{
cnt++;
idx=i;
}
}
if(cnt%2)
{
buf[idx] =' ';
return(1);
}
else
{
return(0);
}
}
int main(void)
{
char str[44] = "天水市秦州區南郭路2啊(工行七裡墩分理處裡家";
if(chkHalfChinese(str,40)==1)
{
printf("true\n");
}
else
{
printf("false\n");
}
printf("%s\n",&str);
return 0;
}
程式程式碼在Linux環境下測試通過,執行結果如下圖所示: