用urllib庫幾行程式碼實現最簡單爬蟲

阿新 • • 發佈：2020-07-19

"""
使用urllib.request()請求一個網頁內容，並且把內容打印出來。

"""

from urllib import request

import chardet

if __name__ == '__main__':

    # 有的網站url使用不了
    url = "https://www.cnblogs.com/gshelldon/p/13332798.html"

    # 開啟url把內容賦值給rsp
    rsp = request.urlopen(url)

    # 存取到記憶體當中是bytes流，使用read方法把rsp的內容讀取出來，賦值給變數html。
    html = rsp.read()

    # 使用decode解碼成我們能夠看懂的格式。
    # print(type(html))         # 檢視返回的格式

    html = html.decode('utf-8')  # 預設的是utf-8
    print(html)

```python

返回的內容是html格式的文字

D:\ProgramData\Anaconda3\envs\spider\python.exe D:/爬蟲/v1-最簡單的爬蟲.py
<!DOCTYPE html>
<html lang="zh-cn">
<head>
    <meta charset="utf-8" />
    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
    <meta name="referrer" content="origin" />
    <meta property="og:description" content="nginx 動靜分離 不需要運維來做，開發做的。 動態請求：該請求會呼叫資料庫中的資料。 靜態請求：使用者請求不會呼叫資料庫。 動態頁面：後端開發寫的需要呼叫資料庫的頁面(python、java、C、p" />
    <meta http-equiv="Cache-Control" content="no-transform" />
 
省略。。。。。。。

用urllib庫幾行程式碼實現最簡單爬蟲

""" 使用urllib.request()請求一個網頁內容，並且把內容打印出來。 """

用Python寫幾行程式碼，一分鐘搞定一天工作量，同事直呼：好傢伙！

前幾天有一個讀者說最近要整理幾千份檔案，頭都要整禿了，不知道能不能用Python解決，我們來看一下，你也可以思考一下。

PaddlePaddle：在 Serverless 架構上十幾行程式碼實現 OCR 能力

飛槳 (PaddlePaddle) 以百度多年的深度學習技術研究和業務應用為基礎，是中國首個自主研發、功能完備、開源開放的產業級深度學習平臺，集深度學習核心訓練和推理框架、基礎模型庫、端到端開發套件和豐富的工具元件

Vue幾行程式碼實現搜尋功能

<!DOCTYPE html> <html lang=\"en\"> <head> <meta charset=\"UTF-8\"> <title>search</title>

java 7行程式碼實現一個簡單的斐波那契數列

技術標籤：基本演算法java 二話不說直接上程式碼。沒啥思想，就是簡單 public static void main(String[] args) {

Python用5行程式碼實現批量摳圖的示例程式碼

前言對於會PhotoShop的人來說，摳圖是非常簡單的操作了，有時候幾秒鐘就能扣好一張圖。不過一些比較複雜的圖，有時候還是要畫點時間的，今天就給大家帶了一個非常快速簡單的辦法，用Python來批量摳取人像。

簡單的幾行程式碼，用Python生成二維碼影象

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

演算法專題 | 10行程式碼實現的最短路演算法——Bellman-ford與SPFA

今天是演算法資料結構專題的第33篇文章，我們一起來聊聊最短路問題。最短路問題也屬於圖論演算法之一，解決的是在一張有向圖當中點與點之間的最短距離問題。最短路演算法有很多，比較常用的有bellman-ford、dijkstr

用Python 80行程式碼實現一個微信訊息撤回捕捉功能

自從微信出了這個訊息撤回功能小編我都已經快被折磨死了，小編本來就是個好奇心比較重的人，微信出了這個功能之後小編感覺身體一天不如一天了，每次看著女神發來的資訊又撤回，可謂是心裡癢癢啊。所以小編就寫了一個

幾行程式碼帶你實現人臉識別。Python 就是這麼簡單

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

在python經典面試試題中，設計原理，接下來看幾行程式碼怎麼實現的

程式碼實現看完了設計模式的原理，我們下面來試著用程式碼來實現一下，由於這個設計模式非常簡單，這個程式碼並不長只有幾行：

python用700行程式碼實現http客戶端

本文用python在TCP的基礎上實現一個HTTP客戶端,該客戶端能夠複用TCP連線,使用HTTP1.1協議.

教你如何用幾行程式碼擼個數據庫！

最近重讀《資料密集型應用系統設計》這本書，看到第三章《資料儲存與檢索》，主要講資料庫內部的索引技術。

Kotlin就幾行程式碼？用SharedFlow寫個FlowEventBus

背景跨頁面通訊是一個比較常見的場景，通常我們會選擇使用EventBus，但EventBus無法感知生命週期，收到訊息就會回撥，所以有了LiveData之後很快就有了LiveEventBus。不過它也有缺點，比如不能切換接收執行緒。現在

JavaScript用20行程式碼實現虎年春節倒計時

春節將至，小夢相信大家跟小朦夢一樣很激動呀。為了迎接虎年春節到來，小夢擼了一個虎年春節倒計時，僅20行程式碼用就實現啦，是不是很簡單呢？我們用這20行程式碼不僅能做個虎年春節倒計時，還能從中學到JS相關知識

用兩行程式碼實現重試功能，spring-retry真是簡單而優雅

背景最近做的一個需求，需要呼叫第三方介面。正常情況下，介面的響應是符合要求的，只有在網路抖動等極少數的情況下，會存在超時情況。因為是小概率事件，所以一次超時之後，進行一次重試操作應該就可以了。重試很簡

Blazor元件自做九: 用20行程式碼實現檔案上傳,瀏覽目錄功能 (3)

接上篇 Blazor元件自做九: 用20行程式碼實現檔案上傳,瀏覽目錄功能 (2) 7. 使用配置檔案指定監聽地址

幾百行程式碼實現一個指令碼直譯器

前言最近又在重新學習編譯原理了，其實兩年前也複習過，當初是為了能實現通過 MySQL 的 DDL 生成 Python 中 sqlalchemy 的 model。

13行程式碼實現：Python實時視訊採集（附原始碼）

13行程式碼實現：Python實時視訊採集（附原始碼）一、前言本文是《人臉識別完整專案實戰》系列博文第3部分：程式設計篇（Python版），第1節《Python實時視訊採集程式設計》，本章內容系統介紹：基於Python+opencv如

Python 70行程式碼實現簡單算式計算器解析

描述：使用者輸入一系列算式字串，程式返回計算結果。要求：不使用eval、exec函式。

用urllib庫幾行程式碼實現最簡單爬蟲

返回的內容是html格式的文字

相關推薦