【Python】【爬蟲系列】【爬狼】002_自定義獲取網頁原始碼的函式

阿新 • • 發佈：2021-12-15

自定義獲取網頁原始碼的函式，基於上一篇爬狼系列筆記

在上一篇筆記（【Python】【爬蟲系列】【爬狼】001_urllib_get_獲取響應結果頁面程式碼 - 萌狼藍天 - 部落格園 (cnblogs.com/mllt)）我們將一個網頁，解析為了文件（原始碼）

如果每解析一次網頁，都要寫那麼多內容，就會很不方便

在一次爬蟲專案，我們需要解析多個網頁

那麼，使用 “自定義函式”可以大大提高效率，簡化程式碼

def xrilang_UrlToDocument(url):
    """
    '本函式作用為獲取網頁原始碼'
    :param url: 需要解析的網頁連結
    :return: string 網頁原始碼 編碼方式為utf-8
    """
    header = {
        "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.93 Safari/537.36 Edg/96.0.1054.53"
    }
    request_Info = urllib.request.Request(url=url, headers=header)
    response = urllib.request.urlopen(request_Info)
    response_html = response.read().decode("utf-8")
    return response_html

作者：萌狼藍天，轉載請註明原文連結：https://www.cnblogs.com/mllt/p/python_pc_pl_edu_002.html | 萌狼藍天@嗶哩嗶哩 | QQ：3447902411（僅限技術交流，新增請說明方向）

【Python】【爬蟲系列】【爬狼】002_自定義獲取網頁原始碼的函式

自定義獲取網頁原始碼的函式，基於上一篇爬狼系列筆記在上一篇筆記（【Python】【爬蟲系列】【爬狼】001_urllib_get_獲取響應結果頁面程式碼 - 萌狼藍天 - 部落格園 (cnblogs.com/mllt)）我們將一個網頁，解析為

【Python】【爬蟲】【爬狼】004_正則規則模板及其應用

正則規則模板及其應用。通過使用正則表示式，取出我們想要的內容正則規則模板與應用（一）

【Python高階程式設計016 ● 多工程式設計 ● 死鎖】

---------Python基礎程式設計--------- Author : AI菌【內容講解】一、執行緒之間共享全域性變數資料出現錯誤問題的解決辦法:執行緒同步

【Python高階程式設計020 ● 網路程式設計 ● TCP的介紹】

---------Python基礎程式設計--------- Author : AI菌【內容講解】 1.死鎖的概念: 一直等待對方釋放鎖的情景就是死鎖。

【Python高階程式設計021 ● 網路程式設計 ● socket的概念】

---------Python基礎程式設計--------- Author : AI菌【內容講解】 1、網路應用程式之間的通訊流程

【Python高階程式設計031 ● http協議 ● http請求報文】

---------Python基礎程式設計--------- Author : AI菌【內容講解】一、調出開發者工具

【C#】 List按指定欄位的給出的自定義順序進行排序

<div id="cnblogs_post_description" style="display: none"> List按指定欄位的給出的自定義順序進行排序

【Azure API 管理】APIM整合內網虛擬網路後，啟用自定義路由管理外出流量經過防火牆(Firewall)，遇見APIs載入不出來問題

問題描述使用 Azure 虛擬網路，Azure APIM 可以管理無法通過 Internet 訪問的 API，達到以保護企業內部的後端API的目的。在虛擬網路中，啟用網路安全組(NSG：Network Security Group)來控制出站，入站的埠，我們可以

【Maven實戰技巧】「外掛使用專題」Maven-Assembly外掛實現自定義打包

前提概要最近我們專案越來越多了，然後我就在想如何才能把基礎服務的打包方式統一起來，並且可以實現按照我們的要求來生成，通過研究，我們通過使用maven的assembly外掛完美的實現了該需求，爽爆了有木有。本文分

【Azure 應用服務】App Service .NET Core專案在Program.cs中自定義新增的logger.LogInformation,部署到App Service上後日志不顯示Log Stream中的問題

問題描述在.Net Core 5.0 專案中，新增Microsoft.Extensions.Logging.AzureAppServices 和Microsoft.Extensions.Logging.Abstractions外掛，並且在專案中新增logging.AddAzureWebAppDiagnostics()