python 製作網站篩選工具(附原始碼)

阿新 • • 發佈：2021-01-21

一．思路

1.整體思路

python 製作網站篩選工具(附原始碼)

2.程式碼思路

python 製作網站篩選工具(附原始碼)

思路很簡單，就是用python傳送請求，提取響應體中的狀態碼加以判斷，最後儲存到本地txt文字中，以實現網站資訊的篩選。

二．撰寫程式碼

import time
import requests
import urllib3
from concurrent.futures import ThreadPoolExecutor

#取原始檔中的網址並且去重
def get_url(old_file):
  with open(old_file,'r',encoding='gbk')as f:
    urllist=list(set(f.readlines()))
    return urllist

#主體，傳送請求，通過異常捕獲判斷能否響應，通過狀態碼判斷網閘能否正常訪問
def request(url):
  url=url.strip()
  #構造請求頭資訊
  headers = {
    'Connection': 'keep-alive','User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/78.0.3904.108 Safari/537.36'
  }
  try:
    #忽略證書安全警告
    urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)
    r=requests.get(url,headers=headers,timeout=10,verify=False)#timeout設定超時時間，我設定了10s，使用verif=False忽略sll認證
    if r.status_code==200:
      cost_time=r.elapsed.total_seconds()#計算訪問耗時
      print(url,' ----->【能訪問】訪問耗時:\033[35;46m{:.2f}s\033[0m'.format(cost_time))
      can_access_save_to_txt(url)
    else:
      print(url,' ----->不能訪問,狀態碼為:\033[31;44m{}\033[0m'.format(r.status_code))
  except:
    print(url,原因：\033[31;44m不能響應\033[0m')


#將能訪問的網址儲存到new_file
def can_access_save_to_txt(result):
  result=result.strip()
  #篩選出不是.apk的url,此判斷可以不加
  if not result.endswith('.apk'):
    with open(aim_file,'a')as f:
      f.write(result+'\n')


def main():
  s_time=time.time()
  #使用執行緒池，建立四條執行緒。
  pool=ThreadPoolExecutor(max_workers=4)
  urls=get_url(orign_file)
  for url in urls:
    pool.submit(request,url)
  pool.shutdown()
  e_time=time.time()
  sum_time=int(e_time-s_time)
  if sum_time>60:
    print(f'\033[38;46m 程式正常執行結束退出！共耗時:【{sum_time//60}分鐘】 \033[0m')
  elif sum_time/60>1:
    print(f'\033[38;46m 程式正常執行結束退出！共耗時:【{sum_time//60*60}小時】 \033[0m')


if __name__ == '__main__':
  orign_file=r'E:\test.txt'
  #篩選後能訪問的網址
  aim_file="./data/test_can_access.txt"
  #篩選後不能訪問的網址
  main()

三．執行結果

python 製作網站篩選工具(附原始碼)

四．總結

本次使用python撰寫了一款篩選網站的小工具，將網站大致分為能訪問和不能訪問兩類，將能夠訪問且狀態碼為200的網站儲存到了檔案中，最終實現了網站的篩選。思路、程式碼方面有什麼不足歡迎各位大佬指正、批評！

以上就是python 製作網站篩選工具(附原始碼)的詳細內容，更多關於python 製作網站篩選工具的資料請關注我們其它相關文章！

python 製作網站篩選工具(附原始碼)

一．思路 1.整體思路 2.程式碼思路思路很簡單，就是用python傳送請求，提取響應體中的狀態碼加以判斷，最後儲存到本地txt文字中，以實現網站資訊的篩選。

Python製作簡易計算器，附原始碼與註釋！

工具：python 3.6pycharm編輯器先簡單介紹一下使用的Tkinter圖形庫：很多人學習python，不知道從何學起。很多人學習python，掌握了基本語法過後，不知道在哪裡尋找案例上手。很多已經做案例的人，卻不

【Python爬蟲】入門級爬蟲案例，20行程式碼爬取網站圖片（附原始碼）

知識點爬蟲的步驟 requests parsel xpath資料解析爬蟲四個步驟: 1.獲取網頁地址 (目標地址)2.傳送請求3.資料解析4.儲存本地

Python實戰案例，PyQt5模組，實現疫情資訊快速檢視工具(附原始碼)

效果展示執行後介面預設是百度的引擎下面展示切換360引擎介面結果前言今天給大家介紹的是Python疫情資訊快速檢視工具，在這裡給需要的小夥伴們程式碼，並且給出一點小心得。

13行程式碼實現：Python實時視訊採集（附原始碼）

13行程式碼實現：Python實時視訊採集（附原始碼）一、前言本文是《人臉識別完整專案實戰》系列博文第3部分：程式設計篇（Python版），第1節《Python實時視訊採集程式設計》，本章內容系統介紹：基於Python+opencv如

利用Python製作翻譯小工具

話不多說，直接上程式碼。 Component檔案： # coding:utf-8 from tkinter import * from tkinter import ttk

python製作命令列工具——fire

一、快速介紹來一波官方介紹。 Python Fire是一個庫，用於從任何Python物件自動生成命令列介面。

史上最好用的遠端桌面工具(附原始碼)

大家都是用的哪一款遠端控制工具呢？向日葵確實還可以，支援多平臺、跨網路，但是必須要註冊 Oray賬號才行。雖然與免費版，但是用過的都知道，還是得http://www.cppcns.com付費才管用！

用python製作檔案搜尋工具，深挖電腦裡的【學習大全】

咳咳~懂得都懂啊點選此處找管理員小姐姐領取正經資料~ 開發環境直譯器： Python 3.8.8 | Anaconda, Inc.

Python製作動態二維碼（附原始碼，複製再貼修改路徑名字即可）

前言每一行程式碼都給你滿滿的註釋，讓你輕鬆瞭解程式碼意思先看原圖程式碼如下：

福利！Python製作動態字元畫（附原始碼）

字元畫，一種由字母、標點、漢字或其他字元組成的圖畫。簡單的字元畫是利用字元的形狀代替圖畫的線條來構成簡單的人物、事物等形象，它一般由人工製作而成；複雜的字元畫通常利用佔用不同數量畫素的字元代替圖畫上

❤️七夕佳節，用Python製作表白神器，程式設計師也應該擁有愛情！【附原始碼，建議收藏】❤️

前言七夕佳節又雙叒叕來了！七夕來了，指南也總得送點什麼給大家表示一下，在這個洋溢著甜美愛情的節日裡，程式設計師也應該擁有愛情！今天在這裡就給大家分享一個Python仿製抖音表白小軟體

【Python爬蟲】尺度太大了！爬一個專門看小姐姐的網站，寫一段緊張刺激的程式碼（附原始碼）

前言今天我們通過Python爬取小姐姐圖片網站上的美圖，零基礎學會通用爬蟲，當然我們還可以實現多執行緒爬蟲，加快爬蟲速度

[附原始碼]Python計算機畢業設計大學生二手物品交易網站Django（程式+LW）

Override the entrypoint of an image Introduced in GitLab and GitLab Runner 9.4. Read more about the extended configuration options.

使用Python給頭像加上聖誕帽或聖誕老人小圖示附原始碼

隨著聖誕的到來，想給給自己的頭像加上一頂聖誕帽。如果不是頭像，就加一個聖誕老人陪伴。

如何基於Python製作有道翻譯小工具

這篇文章主要介紹瞭如何基於Python製作有道翻譯小工具,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python編寫一個驗證碼圖片資料標註GUI程式附原始碼

做驗證碼圖片的識別，不論是使用傳統的ORC技術，還是使用統計機器學習或者是使用深度學習神經網路，都少不了從網路上採集大量相關的驗證碼圖片做資料集樣本來進行訓練。

使用Python製作一個打字訓練小工具

一、寫在前面　　說道程式設計師，你會想到什麼呢？有人認為程式設計師象徵著高薪，有人認為程式設計師都是死肥宅，還有人想到的則是996和 ICU。

python製作英語翻譯小工具程式碼例項

這篇文章主要介紹了python製作英語翻譯小工具程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python製作簡易版小工具之計算天數的實現思路

需求給定一個日期，格式如 “2020-2-12”，計算出這個日期是 2020 年的第幾天？