用Python3實現一個簡單的爬蟲。

阿新 • • 發佈：2019-01-05

import urllib
import urllib.request

def loadPage(url,filename):
    """
    作用：根據url傳送請求，獲取html資料;
    :param url:
    :return:
    """
    request=urllib.request.Request(url)
    html1= urllib.request.urlopen(request).read()
    return  html1.decode('utf-8')

def writePage(html,filename):
    """
    作用將html寫入本地

    :param html: 伺服器相應的檔案內容
    :return:
    """ 

    with open(filename,'w') as f:
        f.write(html)
    print('-'*30)
def tiebaSpider(url,beginPage,endPage):
    """
    作用貼吧爬蟲排程器，負責處理每一個頁面url;
    :param url:
    :param beginPage:
    :param endPage:
    :return:
    """
    for page in range(beginPage,endPage+1):
        pn=(page - 1)*50
        fullurl=url+"&pn=" 
+str(pn)
        print(fullurl)
        filename='第'+str(page)+'頁.html'
        html= loadPage(url,filename)

        writePage(html,filename)



if __name__=="__main__":
    kw=input('請輸入你要需要爬取的貼吧名:')
    beginPage=int(input('請輸入起始頁'))
    endPage=int(input('請輸入結束頁'))
    url='https://tieba.baidu.com/f?' 

    kw1={'kw':kw}
    key = urllib.parse.urlencode(kw1)
    fullurl=url+key
    tiebaSpider(fullurl,beginPage,endPage)

為了返回的html一定要進行decode編碼一下。

用Python3實現一個簡單的爬蟲。

import urllib import urllib.request def loadPage(url,filename): """ 作用：根據url傳送請求，獲取html資料;

用Nodejs實現一個簡單的爬蟲功能。（ES6標準）

Nodejs版本：v10.11.0 依賴模組：express，superagent，cheerio 程式碼： const express = require('express'); const superagent = require('superagent'); co

類方法實現：用python實現一個簡單的單詞本，添加/查找/刪除單詞。

end code div keys style 成功 move print utf 1.實現一個簡單的單詞本，功能： ①添加單詞，當所添加的單詞已存在時，讓用戶知道 ②查找單詞，當查找的單詞不存在時，讓用戶知道 ③刪除單詞，當刪除的單詞不存在時，讓用戶知道以上

用java實現一個簡單的單用戶登陸功能的思路

get 單用戶這樣的簡單的 lock ref 數據庫清除一個引用所謂“單用戶單賬戶登錄”是指：在同一系統中，一個用戶名不能在兩個地方同時登錄。我們參照 QQ 實現效果：當某賬號在 A 處登錄後，在未退出的情況下，如果再到 B 處登錄，那麽，系統會擠下 A 處

用 C# 實現一個簡單的 Rest Service 供外部調用

message [] operation rem adk www span method title 用 C# 實現一個簡單的 Restful Service 供外部調用，大體總結為4點： The service contract (the methods it o

java算法面試題：排序都有哪幾種方法？請列舉。用JAVA實現一個快速排序。選擇冒泡快速集合至少4種方法排序

算法 err div println rda print 算法面試 ++ 快速排序 package com.swift; import java.util.ArrayList; import java.util.Collections; import java.util

自己用-Netty-實現一個簡單的-RPC

轉自：http://thinkinjava.cn/2018/03/%E8%87%AA%E5%B7%B1%E7%94%A8-Netty-%E5%AE%9E%E7%8E%B0%E4%B8%80%E4%B8%AA%E7%AE%80%E5%8D%95%E7%9A%84-RPC/ 目錄：需求

用Vue實現一個簡單的輪播效果

Vue實現簡單的輪播效果，用的的一些常用系統指令： <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <meta name="viewport" conte

【人工智慧】用Python實現一個簡單的人臉識別，原來我和這個明星如此相似

近幾年來，興起了一股人工智慧熱潮，讓人們見到了AI的能力和強大，比如影象識別，語音識別，機器翻譯，無人駕駛等等。總體來說，AI的門檻還是比較高，不僅要學會使用框架實現，更重要的是，需要有一定的數學基礎，如線性代數，矩陣，微積分等。幸慶的是，國內外許多大神都已經給我們造好“輪子”，我們可以直接來使用某些模型

【人工智能】用Python實現一個簡單的人臉識別，原來我和這個明星如此相似

數值但是智能深度學習 lib python 數學三方 python實現近幾年來，興起了一股人工智能熱潮，讓人們見到了AI的能力和強大，比如圖像識別，語音識別，機器翻譯，無人駕駛等等。總體來說，AI的門檻還是比較高，不僅要學會使用框架實現，更重要的是，需要有一定的數

用js實現一個簡單的mvvm

這裡利用的object.defineproperty() 方法; <input id='input'><p id='p'><p/>js: const data={}; const input=documen

用TextView實現一個簡單的Android資訊顯示工具

本文用 TextView 實現一個在手機上顯示 Android 資訊的工具類。比如涉及到訊號的傳遞時，那種類似日誌記錄的功能。先看圖：先看佈局檔案的程式碼，注意 TextView 裡面的幾個屬性就可以了。 <?xml version="1.0" encoding="utf-8"

用Python實現一個簡單的——人臉相似度對比

近幾年來，興起了一股人工智慧熱潮，讓人們見到了AI的能力和強大，比如影象識別，語音識別，機器翻譯，無人駕駛等等。總體來說，AI的門檻還是比較高，不僅要學會使用框架實現，更重要的是，需要有一定的數學基礎，如線性代數，矩陣，微積分等。幸慶的是，國內外許多大神都已經給我們造好“輪子”，我們可以直

【很有趣】用Python實現一個簡單的人臉識別，原來我和這個明星如此相似

近幾年來，興起了一股人工智慧熱潮，讓人們見到了AI的能力和強大，比如影象識別，語音識別，機器翻譯，無人駕駛等等。總體來說，AI的門檻還是比較高，不僅要學會使用框架實現，更重要的是，需要有一定的數學基礎，如線性代數，矩陣，微積分等。幸慶的是，國內外許多大神都已經給我們造好“輪子”，我們可

用echarts實現一個簡單的生成圖表的功能

說實話一直想做一個可以生成圖表的檔案，但是一直研究不明白，曾經也看過很多的類似技術的檔案，D3.js，Hcharts，Echarts都看過，但是看不下去，一個是api寫的很死板，一個是自己事情比較多，今天不是很忙，簡單的看了一下，寫一個簡單的生成圖表，很簡單，沒有什麼技術含量

用mpvue實現一個簡單的demo

序言上一篇從騰訊後臺搭建以及搭建本地開發環境這兩個方面進行總結。在進行編碼時，這兩種搭建方式也能提供更好的開發環境，提高實際的開發效率。這一節主要分享的便是如果用mpvue實現一個基礎的demo，這個demo主要會從mpvue的特性、結構，以及生命週期來實現，期間遇到

用java實現一個簡單的ArrayList

重複造輪子雖然不可取,但是溫習一下資料結構,光看不做總是少了什麼，所以也來實現一下List，希望多多包涵。既然要實現一個List,先來簡單說一下List的定義線性表是最基本、最簡單、也是最常用的一種資料結構。線性表中資料元素之間的關係是一對一的關係

python3實現一個簡單的訂票功能

#原創：成都-傑森 1 import prettytable as pt 2 3 def show_tickt(row_num): 4 tb = pt.PrettyTable() 5 tb.field_names = ["行號","座位1", "座位2", "座位3", "座

用java實現一個簡單的學生管理系統

用Java如何實現一個用陣列作為儲存結構的簡易的學生管理系統？首先，我們定義一個student類,在其中新增私有化的成員變數，通過getter和setter方法進行呼叫 public class Students { // 學號，姓名，性別，年

用Python 實現一個簡單的postman功能

用Python 實現一個簡單的postman功能 import os import requests import json import defaultdict as default_dict class PostMan: __instance = None

用Python3實現一個簡單的爬蟲。

相關推薦