1. 程式人生 > >python抓取時gzip解壓

python抓取時gzip解壓

'''
根據URL返回內容,有些頁面可能需要gzip解壓縮
'''
def getUrlContent(url):
    #返回頁面內容
    doc = urllib.request.urlopen(url).read()
    #解碼
    try:
        html=gzip.decompress(doc).decode("utf-8")
    except:
        html=doc.decode("utf-8")
    return html