python爬取免費代理連結

阿新 • • 發佈：2020-07-11

https://www.kuaidaili.com/free/

程式碼如下：

import requests
from bs4 import BeautifulSoup

# 獲取網站資料
def get_data(url):
    headers = {
        'user-agent': 'Mozilla/5.0'
    }
    html = requests.get(url, headers)
    html.encoding = 'utf-8'
    return html.text
# 解析網站資料
def parse_dara(html):
    soup = BeautifulSoup(html, ' 
html.parser')
    '''
        protocol = soup.find_all(attrs={'data-title': '型別'})
        ip = soup.find_all(attrs={'data-title': 'IP'})
        port = soup.find_all(attrs={'data-title': 'PORT'})
    '''
    # 協議 地址 埠
    protocol = soup.select('#list > table > tbody > tr > td:nth-child(4) 
')
    ip = soup.select('#list > table > tbody > tr > td:nth-child(1)')
    port = soup.select('#list > table > tbody > tr > td:nth-child(2)')
    data = []       # 存放代理連結
    for i in range(0, len(ip)):          # 要求len(ip), len(port) len(protocol)的值一樣
        temp = protocol[i].get_text()+' 
://'+ip[i].get_text()+':'+port[i].get_text()     # 拼接成url
        data.append(temp)                                                               # 拼接後的資料，加入到列表
    return data

# 儲存資料
def save_data(data):
    for item in data:
        with open('output\\'+proxy, 'a+') as f:
            f.write(item)
            f.write('\n')

if __name__=='__main__':
    proxy = 'proxy.txt'
    url = 'https://www.kuaidaili.com/free/inha/1'
    html = get_data(url)
    data = parse_dara(html)
    save_data(data)
    print('爬蟲結束')

結果：

只爬了第一頁的代理，其他幾頁，加個迴圈就解決了。

python爬取免費代理連結

https://www.kuaidaili.com/free/ 程式碼如下： import requests from bs4 import BeautifulSoup # 獲取網站資料

python 爬取免費簡歷模板網站的示例

程式碼 # 免費的簡歷模板進行爬取本地儲存 # http://sc.chinaz.com/jianli/free.html # http://sc.chinaz.com/jianli/free_2.html

爬取免費代理IP並測試

爬取免費代理IP並測試寫在開頭：這次總共爬了三個代理ip的網站，前兩個網站經過測試，ip並不能訪問我真正想爬的網站

python實現的爬取電影下載連結功能示例

本文例項講述了python實現的爬取電影下載連結功能。分享給大家供大家參考，具體如下：

python爬取高匿代理IP（再也不用擔心會進小黑屋了）

為什麼要用代理IP 很多人學習python，不知道從何學起。很多人學習python，掌握了基本語法過後，不知道在哪裡尋找案例上手。很多已經做案例的人，卻不知道如何去學習更加高深的知識。那麼針對這三類人，我給大家提供

關於爬蟲ip：爬取快代理的免費代理ip

import requests import parsel import time,random headers = { \'User-Agent\': \'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36\'

Python 爬取B站UP主的所有視訊連結及詳細資訊

標題：Python 爬取B站UP主的所有視訊連結及詳細資訊原文連結：https://blog.xieqiaokang.com/posts/36033.html

python 爬取百度文庫並下載(免費文章限定)

import requests import re import json import os session = requests.session() def fetch_url(url): return session.get(url).content.decode(\'gbk\')

python爬取CVPR論文標題、作者、pdf連結並儲存到MySQL資料庫

訪問外網，程式跑的時間會長一點，耐心等待！全部原始碼： # -*- coding = utf-8 -*-

用 Python 爬取網易嚴選妹子內衣資訊，探究妹紙們的偏好

今天繼續來分析爬蟲資料分析文章，一起來看看網易嚴選商品評論的獲取和分析。

Python爬取資料並寫入MySQL資料庫的例項

首先我們來爬取 http://html-color-codes.info/color-names/ 的一些資料。按 F12 或 ctrl+u 審查元素，結果如下:

用python爬取歷史天氣資料的方法示例

某天氣網站（www.數字.com）存有2011年至今的天氣資料，有天看到一本爬蟲教材提到了爬取這些資料的方法，學習之，並加以改進。

Python爬取騰訊視訊評論的思路詳解

一、前提條件安裝了Fiddler了（用於抓包分析）谷歌或火狐瀏覽器如果是谷歌瀏覽器，還需要給谷歌瀏覽器安裝一個SwitchyOmega外掛，用於代理伺服器

Python爬取愛奇藝電影資訊程式碼例項

這篇文章主要介紹了Python爬取愛奇藝電影資訊程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python爬取豆瓣視訊資訊程式碼例項

這篇文章主要介紹了Python爬取豆瓣視訊資訊程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python爬取破解無線網路wifi密碼過程解析

前言今天從WiFi連線的原理，再結合程式碼為大家詳細的介紹如何利用python來破解WiFi。

Python爬取知乎圖片程式碼實現解析

首先，需要獲取任意知乎的問題，只需要你輸入問題的ID，就可以獲取相關的頁面資訊，比如最重要的合計有多少人回答問題。

python爬取Ajax動態載入網頁過程解析

常見的反爬機制及處理方式 1、Headers反爬蟲：Cookie、Referer、User-Agent 解決方案: 通過F12獲取headers,傳給requests.get()方法

python 爬取古詩文存入mysql資料庫的方法

使用正則提取資料，請求庫requests,看程式碼，在存入資料庫時，報錯ERROR 1054 (42S22): Unknown column ‘title\' in ‘field list\'。原來是我寫sql 有問題，sql = “insert into poem(title,author,content,creat

python3爬取torrent種子連結例項

本文環境是python3,採用的是urllib,BeautifulSoup搭建。說下思路，這個專案分為管理器，url管理器，下載器，解析器，html檔案生產器。各司其職，在管理器進行排程。最後將解析到的種子連線生產html檔案顯示。當然也

python爬取免費代理連結

相關推薦