1. 程式人生 > 程式設計 >C語言字串轉換為Python字串的方法

C語言字串轉換為Python字串的方法

問題

怎樣將C中的字串轉換為Python位元組或一個字串物件?

解決方案

C字串使用一對 char *int 來表示, 你需要決定字串到底是用一個原始位元組字串還是一個Unicode字串來表示。 位元組物件可以像下面這樣使用 Py_BuildValue() 來構建:

char *s; /* Pointer to C string data */
int len; /* Length of data */

/* Make a bytes object */
PyObject *obj = Py_BuildValue("y#",s,len);

如果你要建立一個Unicode字串,並且你知道 s 指向了UTF-8編碼的資料,可以使用下面的方式:

PyObject *obj = Py_BuildValue("s#",len);

如果 s 使用其他編碼方式,那麼可以像下面使用 PyUnicode_Decode() 來構建一個字串:

PyObject *obj = PyUnicode_Decode(s,len,"encoding","errors");

/* Examples /*
obj = PyUnicode_Decode(s,"latin-1","strict");
obj = PyUnicode_Decode(s,"ascii","ignore");

如果你恰好有一個用 wchar_t *,len 對錶示的寬字串, 有幾種選擇性。首先你可以使用 Py_BuildValue()

wchar_t *w; /* Wide character string */
int len; /* Length */

PyObject *obj = Py_BuildValue("u#",w,len);

另外,你還可以使用 PyUnicode_FromWideChar() :

PyObject *obj = PyUnicode_FromWideChar(w,len);

對於寬字串,並沒有對字元資料進行解析——它被假定是原始Unicode編碼指標,可以被直接轉換成Python。

討論

將C中的字串轉換為Python字串遵循和I/O同樣的原則。 也就是說,來自C中的資料必須根據一些解碼器被顯式的解碼為一個字串。 通常編碼格式包括ASCII、Latin-1和UTF-8. 如果你並不確定編碼方式或者資料是二進位制的,你最好將字串編碼成位元組。 當構造一個物件的時候,Python通常會複製你提供的字串資料。 如果有必要的話,你需要在後面去釋放C字串。 同時,為了讓程式更加健壯,你應該同時使用一個指標和一個大小值, 而不是依賴NULL結尾資料來建立字串。

以上就是C語言字串轉換為Python字串的方法的詳細內容,更多關於C語言字串轉換為Python字串的資料請關注我們其它相關文章!