windows下python3安裝chardet外掛
阿新 • • 發佈:2019-01-22
安裝chardet外掛過程很痛苦,歷經了不少周折,最後也是莫名其妙的在聯網的狀態(確切的說是翻牆聯網)下安裝成功了,對其原理任然不甚瞭解。
安裝過程如下:
2,下載後解壓,放在Python\Lib\site-packages下,如我的是"D:\Python33\Lib\site-packages\chardet2-2.0.3"
然後開啟命令列,輸入"python D:\Python33\Lib\site-packages\chardet2-2.0.3\setup.py
install"若果不成功,檢視第三步
3,安裝setuptools,下載地址,此版本為3.4.1,若需要其他版本,可直接在google中搜索“名字+版本號”,然後點選快照即可下載,下載完成後,安裝完畢,再來重新安裝chardet
測試程式碼:
import urllib.request import sys reload(sys) import chardet req = urllib.request.urlopen(r"http://www.baidu.com")##這裡可以換成http://www.baidu.com,http://www.sohu.com content = req.read() typeEncode = sys.getfilesystemencoding()##系統預設編碼 infoencode = chardet.detect(content).get('encoding','utf-8')##通過第3方模組來自動提取網頁的編碼 html = content.decode(infoencode,'ignore').encode(typeEncode)##先轉換成unicode編碼,然後轉換系統編碼輸出 print (html)
p.s:但有個mbs的問題任然沒有解決,繼續改進。。。(報錯:UnicodeEncodeError: 'mbcs' codec can't encode characters in position 0--1: invalid character)