1. 程式人生 > >Python處理中文文字字元時提取某個漢字或字元的方法

Python處理中文文字字元時提取某個漢字或字元的方法

最近學了python扒取網頁論壇資訊,其實python在處理字串和文字時,其封裝好的函式功能很強悍的,何以很方便的呼叫處理資訊。廢話不多說,我在爬取論壇資訊時遇到一個回帖資訊,上邊二樓及以下樓層回帖資訊上標註比如“2樓網友回覆”“3樓網友回覆”等等,我要獲取樓層數,說白了就睡獲取第一個字元,然後轉換為int型就OK了,可是在網頁原始碼中get_text(),扒取後獲得的是 '2樓網友回覆',是文字資訊,我們可以用python裡的repr()函式或str()函式repr()返回的是一個物件的"官方"字串表示(對python比較友好),絕大多數情況下可以通過求值運算(使用內建函式eval())重新得到該物件。即 obj= eval(repr(obj)),也有情況下,不能夠通過eval()得到原來的物件
str() 生成一個物件的可讀性好的字串表示(對使用者比較友好),它返回的結果通常無法用於eval()求值,但很適用於print語句輸出。