python獲取整個網頁原始碼的方法

阿新 • • 發佈：2020-08-04

1、Python中獲取整個頁面的程式碼：

importrequests
res=requests.get('https://blog.csdn.net/yirexiao/article/details/79092355')
res.encoding='utf-8'
print(res.text)

2、執行結果

例項擴充套件：

from bs4 import BeautifulSoup
import time,re,urllib2
t=time.time()
websiteurls={}
def scanpage(url):
 websiteurl=url
 t=time.time()
 n=0
 html=urllib2.urlopen(websiteurl).read()
 soup=BeautifulSoup(html)
 pageurls=[]
 Upageurls={}
 pageurls=soup.find_all("a",href=True)
 for links in pageurls:
  if websiteurl in links.get("href") and links.get("href") not in Upageurls and links.get("href") not in websiteurls:
   Upageurls[links.get("href")]=0
 for links in Upageurls.keys():
  try:
   urllib2.urlopen(links).getcode()
  except:
   print "connect failed"
  else:
   t2=time.time()
   Upageurls[links]=urllib2.urlopen(links).getcode()
   print n,print links,print Upageurls[links]
   t1=time.time()
   print t1-t2
  n+=1
 print ("total is "+repr(n)+" links")
 print time.time()-t
scanpage(http://news.163.com/)

到此這篇關於python獲取整個網頁原始碼的方法的文章就介紹到這了,更多相關python如何獲取整個頁面內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

python獲取整個網頁原始碼的方法

1、Python中獲取整個頁面的程式碼： importrequests res=requests.get(\'https://blog.csdn.net/yirexiao/article/details/79092355\')

iApp獲取ANHK網頁原始碼

所需控制元件瀏覽器 ID1 文字 ID2 載入事件 //瀏覽器控制元件ID s id1=1 //文字控制元件ID

python xpath 解析網頁常用方法總結

python xpath解析網頁用到的是lxml庫，lxml的使用方法可以官方文件 http://lxml.de/lxmlhtml.html

Python requests模組基礎使用方法例項及高階應用(自動登陸,抓取網頁原始碼)例項詳解

1、Python requests模組說明 requests是使用Apache2 licensed 許可證的HTTP庫。用python編寫。

Python requests獲取網頁常用方法解析

這篇文章主要介紹了Python requests獲取網頁常用方法解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

【Python】【爬蟲系列】【爬狼】002_自定義獲取網頁原始碼的函式

自定義獲取網頁原始碼的函式，基於上一篇爬狼系列筆記在上一篇筆記（【Python】【爬蟲系列】【爬狼】001_urllib_get_獲取響應結果頁面程式碼 - 萌狼藍天 - 部落格園 (cnblogs.com/mllt)）我們將一個網頁，解析為

Python獲取Redis所有Key以及內容的方法

一、獲取所有Key # -*- encoding: UTF-8 -*- __author__ = \"Sky\" import redis pool=redis.ConnectionPool(host=\'127.0.0.1\',port=6379,db=0)

python獲取網路圖片方法及整理過程詳解

這篇文章主要介紹了python獲取網路圖片方法及整理過程詳解,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python獲取統計自己的qq群成員資訊的方法

首先說明一下需要使用的工具以及技術：python3 + selenium selenium安裝方法：pip install selenium

Python如何優雅獲取本機IP方法

見過很多獲取伺服器本地IP的程式碼，個人覺得都不是很好，例如以下這些不推薦：靠猜測去獲取本地IP方法

Python根據服務獲取埠號的方法

根據服務獲取埠號首先需要下載一個psutil庫然後根據服務名找到PID 找到PID之後，通過pid獲取埠號

使用python獲取郵箱郵件的設定方法

首先我們要在郵箱的設定中開通那個POP3 然後我們要匯入這些包 import poplib from datetime import datetime

Python獲取當前指令碼資料夾(Script)的絕對路徑方法程式碼

Python指令碼有一個毛病，當使用相對路徑時，被另一個不同目錄下的py檔案中匯入時，會報找不到對應檔案的問題。感覺是當前工作目錄變成了匯入py檔案當前目錄。如果你有配置檔案的讀取操作，然後都放在一個py檔案中，

對Python獲取螢幕截圖的4種方法詳解

Python獲取電腦截圖有多種方式，具體如下： PIL中的ImageGrab模組 windows API PyQt pyautogui

Python獲取、格式化當前時間日期的方法

Python獲取當前時間_獲取格式化時間： Python獲取當前時間：使用 time.time( ) 獲取到距離1970年1月1日的秒數(浮點數),然後傳遞給 localtime 獲取當前時間

Python獲取二維陣列的行列數的2種方法

這篇文章主要介紹了Python獲取二維陣列的行列數的2種方法,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python獲取響應某個欄位值的3種實現方法

近期將要對兩個介面進行測試，第一個介面的響應值是第二個介面的查詢條件。為了一勞永逸，打算寫個自動化測試框架。因為請求和響應都是xml格式的，遇到的問題就是怎麼獲取xml響應的某一個值。

python獲取標準的北京時間的原始碼

-- 下載httplib庫：https://pypi.org/project/httplib2/#downloads httplib2-0.18.1-py3-none-any.whl 安裝：pip install xx.whl

python獲取系統記憶體佔用資訊的例項方法

psutil是一個跨平臺庫（http://code.google.com/p/psutil/），能夠輕鬆實現獲取系統執行的程序和系統利用率（包括CPU、記憶體、磁碟、網路等）資訊。它主要應用於系統監控，分析和限制系統資源及程序的管理。它實現了

python獲取百度熱榜連結的例項方法

目標網址： https://www.baidu.com/ 要獲取的內容：連結分析：從下圖可以看出只需要獲取關鍵字，再構建就可以了。

python獲取整個網頁原始碼的方法

相關推薦