C語言字串轉換為Python字串的方法
阿新 • • 發佈:2020-08-03
問題
怎樣將C中的字串轉換為Python位元組或一個字串物件?
解決方案
C字串使用一對 char *
和 int
來表示, 你需要決定字串到底是用一個原始位元組字串還是一個Unicode字串來表示。 位元組物件可以像下面這樣使用 Py_BuildValue()
來構建:
char *s; /* Pointer to C string data */ int len; /* Length of data */ /* Make a bytes object */ PyObject *obj = Py_BuildValue("y#",s,len);
如果你要建立一個Unicode字串,並且你知道 s 指向了UTF-8編碼的資料,可以使用下面的方式:
PyObject *obj = Py_BuildValue("s#",len);
如果 s
使用其他編碼方式,那麼可以像下面使用 PyUnicode_Decode()
來構建一個字串:
PyObject *obj = PyUnicode_Decode(s,len,"encoding","errors"); /* Examples /* obj = PyUnicode_Decode(s,"latin-1","strict"); obj = PyUnicode_Decode(s,"ascii","ignore");
如果你恰好有一個用 wchar_t *,len
對錶示的寬字串, 有幾種選擇性。首先你可以使用 Py_BuildValue()
wchar_t *w; /* Wide character string */ int len; /* Length */ PyObject *obj = Py_BuildValue("u#",w,len);
另外,你還可以使用 PyUnicode_FromWideChar()
:
PyObject *obj = PyUnicode_FromWideChar(w,len);
對於寬字串,並沒有對字元資料進行解析——它被假定是原始Unicode編碼指標,可以被直接轉換成Python。
討論
將C中的字串轉換為Python字串遵循和I/O同樣的原則。 也就是說,來自C中的資料必須根據一些解碼器被顯式的解碼為一個字串。 通常編碼格式包括ASCII、Latin-1和UTF-8. 如果你並不確定編碼方式或者資料是二進位制的,你最好將字串編碼成位元組。 當構造一個物件的時候,Python通常會複製你提供的字串資料。 如果有必要的話,你需要在後面去釋放C字串。 同時,為了讓程式更加健壯,你應該同時使用一個指標和一個大小值, 而不是依賴NULL結尾資料來建立字串。
以上就是C語言字串轉換為Python字串的方法的詳細內容,更多關於C語言字串轉換為Python字串的資料請關注我們其它相關文章!