汪雨田的專欄----c語言，演算法設計，php,linux,mysql

阿新 • • 發佈：2019-01-07

最近遇到一個在C語言當中處理中文的問題，因為漢字和ascii不同，漢字是多位元組編碼方式，ascii只用一個位元組表示，所以在用c語言提供的strlen函式得到的長度是位元組長度; 以下都是utf-8編碼方式，為了得到一個字元(漢字和ascii)有幾種處理方式：

1. 自己寫程式判斷是否為漢字，通過第一個位元組判斷，以下是我寫的一部分程式碼;

int isHanzi(int a) { int t = a & 0xE0; if(t==0xE0){ printf("漢字1/n"); return 3; } t = a & 0xC0; if(t==0xC0){ return 2; } t = a & 0xF0; if(t==0xF0){ return 4; } t = a & 0xF8; if(t==0xF8){ return 5; } t = a & 0xFC; if(t==0xFC){ return 2; } printf("不是/n"); return 1; }

2. 用內建的wchar_t型別 ，

1）. wchar_t ws[]=L"北京bus";

這樣用wcslen(ws)結果就為 5,

int i; setlocale(LC_ALL, "zh_CN.UTF-8"); int len=wcslen(ws); for(i=0; i<len; i++){ printf("%lc/n",ws[i]); }

這是必須設定本地編碼方式 setlocale(LC_ALL,"zh_CN.UTF-8");

2).讀一個檔案後得到的資料，要使資料為wchar_t ，就需要進行字串轉換了.用到函式 mbstowcs，以下是我寫的一個讀文字文件然後轉換的程式

//讀一個文字檔案 FILE *fp = fopen("/home/wyt/data.txt","r"); char buffer[1024]; size_t realLen=0,curLen,length=2048; char *data=(char *)malloc(sizeof(char)*length); char *tmp; while(!feof(fp)){ curLen = fread(buffer,sizeof(char),1024,fp); realLen+=curLen; if(length<=realLen){ tmp = (char *)malloc(sizeof(char)*(length+2048)); memcpy(tmp,data,sizeof(char)*length); length+=2048; free(data); data=tmp; } strcat(data,buffer); } data[realLen]='/0'; printf("%s",data); fclose(fp); wchar_t *data2 = (wchar_t *)malloc(sizeof(wchar_t)*length); //轉換成wchar_t型別 mbstowcs(data2,data,length); size_t ln=wcslen(data2); for(i=0;i<ln;i++){ printf("%lc/n",data2[i]); }

如果 wchar_t 轉換為char 型別，可以用函式 wcstombs

void out(wchar_t name) { if(name<128){ char n[2]; wcstombs(n,&name,sizeof(wchar_t)); n[1]='/0'; printf("%lc,%s,%d/n",name,n,strlen(n)); }else{ char n[3]; wcstombs(n,&name,sizeof(wchar_t)); n[3]='/0'; printf("%lc,%s,%d/n",name,n,strlen(n)); } //n[3]='/0'; }

汪雨田的專欄----c語言，演算法設計，php,linux,mysql

汪雨田的專欄----c語言，演算法設計，php,linux,mysql

2.常用演算法（推導）演算法分類，演算法原理，演算法設計，推導---SVM，DTree，樸素貝葉斯，線性迴歸等；

C語言實現括號匹配，中綴表示式轉字尾表示式並計算的演算法

C語言經典演算法：輸入某年某月某日，判斷這一天是這一年的第幾天？

C語言貪心演算法，關於零錢取整問題

在面試中，你會經常遇到的10大C語言基礎演算法（下）

C 語言的一個錯誤，沒找出原因

C 語言popen函數，實現shell和讀取內容

C語言輸入一個小數，輸出它的立方。輸出保留小數點後的2位數字

學C語言編程初學者，容易常出的錯誤

神奇的C語言，這才是C語言大牛操作，作為面試題，怕是秒殺眾人

開始學習C語言遞歸程序，漢諾（hanoi）塔問題嘗試

C語言經典演算法（九）——遞迴實現二分查詢的兩種方法

C語言經典演算法（八）——遞迴實現斐波那契數列的兩種方法

C語言經典演算法（七）——遞迴實現階乘演算法的兩種方法

C語言：完美數，求1-n之間的

C語言：輸入n，a，求Sn=a+aa+aaa+···+a···

開始學習C語言遞迴程式，漢諾（hanoi）塔問題嘗試

C語言十進位制轉二進位制，並儲存在陣列中

純c語言實現連結串列，實現連結串列增刪改查

汪雨田的專欄----c語言，演算法設計，php,linux,mysql

相關推薦