程式設計（Python）實驗十五網路爬蟲基礎 (1)

阿新 • • 發佈：2021-01-13

實驗目的

1、網路爬蟲的基本原理與規範。
2、掌握使用 Requests 庫獲取靜態網頁資訊。
3、掌握使用 BeautifulSoup4 庫解析網頁資訊。
4、掌握正則表示式的基本用法。

實驗內容

題目中國大學排名定向爬蟲

(1) 檢視 https://www.shanghairanking.cn/rankings/bcur/2020 網頁中關於各大學排名的資訊組織(F12 快捷鍵查閱 html 程式碼)
(2)使用 requests、beautifulsoup4 或 re 庫抓取並解析排名，輸出各大學的排名資訊，如下圖所示。

程式碼

import requests
from bs4 import BeautifulSoup
import  bs4
def getHTMLText(url):
    try:
        r = requests.get(url,timeout=30)
        r.raise_for_status()
        r.encoding = 'utf-8'
        return r.text
    except:
        return ""
def fillUniviList(ulist,html):
    soup = BeautifulSoup( 
html,"html.parser")
    for tr in soup.find('tbody').children:
        if isinstance(tr,bs4.element.Tag):
            tds = tr('td')
            ulist.append([tds[0].text,tds[1].text,tds[4].text])
def printUnivList(ulist,num):
    tplt = "{0:^10}\t{1:{3}^10}\t{2:^10}"
    print(tplt.format 
("排名","學校排名","總分",chr(12288)))
    for i in range(num):
        u = ulist[i]
        print(tplt.format(u[0].strip(),u[1].strip(),u[2].strip(),chr(12288)))

def main():
    uinfo = []
    url = 'https://www.shanghairanking.cn/rankings/bcur/2020'
    html = getHTMLText(url)
    fillUniviList(uinfo,html)
    printUnivList(uinfo,20)
main()

程式設計（Python）實驗十五網路爬蟲基礎 (1)

技術標籤：Python程式設計實驗（SWUST）python正則表示式爬蟲實驗目的 1、網路爬蟲的基本原理與規範。 2、掌握使用 Requests 庫獲取靜態網頁資訊。 3、掌握使用 BeautifulSoup4 庫解析網頁資訊。 4、掌握正則表

程式設計（Python）實驗十一 Tkinter 的使用 (1)

技術標籤：Python程式設計實驗（SWUST）tkinterpython 實驗目的掌握 tkinter 的使用熟悉視覺化介面的設計方法

程式設計（Python）實驗一 Python 執行環境搭建及使用

技術標籤：Python程式設計實驗（SWUST）python 實驗目的熟悉 Python 開發環境的使用熟悉 Python 應用程式的建立與執行掌握 Python 輸入與輸出

程式設計（Python）實驗九檔案與資料格式化

技術標籤：Python程式設計實驗（SWUST）python 實驗目的掌握檔案的基本操作理解一、二維和高維資料的格式化過程掌握 csv 和 json 格式的相互轉換綜合應用組合資料型別與 CSV 和 JSON 資料格式編寫簡單的應用程式

程式設計（Python）實驗八函式

技術標籤：Python程式設計實驗（SWUST）python 實驗目的掌握函式的定義與呼叫過程掌握引數的傳遞方式和傳遞過程理解和使用匿名函式理解遞迴呼叫的思想和方法掌握變數的作用域

面向物件程式設計（python）和部分面向物件高階程式設計

1.類和物件在python中定義類 class 類名（首字母最好大寫）Student （Object(父類)）：

面向物件程式設計（C++）: 實驗4 靜態成員

@ 目錄 @ 目錄實驗要求實驗分析實驗中遇到的坑實驗原始碼實驗要求設計一個玩家類Gamer，包含以下成員：

深入學習C#網路程式設計之HTTP應用程式設計（上）

我們學習網路程式設計最熟悉的莫過於Http，好，我們就從Http入手，首先我們肯定要了解一下http的基本原理和作為，對http的工作原理有

深入學習C#網路程式設計之HTTP應用程式設計（下）

第三篇來的好晚啊，上一篇說了如何向伺服器推送資訊，這一篇我們看看如何\"快好準\"的從伺服器下拉資訊。

C#網路程式設計（一）

這一次的部落格更新，主要內容是自己之前很小夥伴一起寫的一個仿QQ的程式。主要的知識就是網路程式設計（僅支援區域網的通訊、簡單的C/S架構、資料庫（怎麼使用資料庫，因為我不是這個資料庫的設計者）以及桌面

Day08_網路程式設計（上）

Day08_網路程式設計（上） javaWeb：網頁程式設計，B/S 網路程式設計：TCP/IP，C/S 網路程式設計中兩個主要的問題

網路程式設計（一）

#ifdef WIN32 #include<windows.h> #else #include<string.h> #include<unistd.h> #include<stdlib.h>

計算機通訊之謎，帶你徹底理解socket網路程式設計（一）

出現一項技術，首先我們弄懂一下，為什麼要出現。那麼為什麼要出現socket這玩意呢？可以很簡單的用一句話來概括：

計算機通訊之謎，帶你徹底理解socket網路程式設計（二）

在《計算機通訊之謎，帶你徹底理解socket網路程式設計（一）》一文裡我們提到了，客戶端傳送了資料了之後，不管服務端還是客戶端都close退出了，也就是說只能傳送一次資料，這顯然不符合實際的用途。那麼該如何更改程

socket網路程式設計（六）——心跳包問題

1、為何需要心跳包問大家一個問題，如果客戶端和服務端長時間沒有相互發送資料的話，那麼我們怎麼來判斷這個連線是否存在的呢？有些人可能很自然地說直接send一下不就可以了，確實可以這樣進行判斷，那麼我們傳送的

資料庫綜合實驗——客戶訂購登記資料庫之資料庫程式設計（JDBC）

承接上次資料庫設計，來到資料庫程式設計模組！本次部落格目錄一、說明技術棧：Java語言程式設計，JDBC，Swing圖形使用者介面設計，資料庫設計相關工具: IntelliJ IDEA，JDK-15，SSMS，SQL Server。

Python爬蟲技術--基礎篇--面向物件程式設計（中）

1.繼承與多型在OOP程式設計中，當我們定義一個class的時候，可以從某個現有的class繼承，新的class稱為子類（Subclass），而被繼承的class稱為基類、父類或超類（Base class、Super class）。

Python爬蟲技術--基礎篇--面向物件程式設計（上）

面向物件程式設計概述面向物件程式設計——Object Oriented Programming，簡稱OOP，是一種程式設計思想。OOP把物件作為程式的基本單元，一個物件包含了資料和操作資料的函式。

Python爬蟲技術--基礎篇--面向物件高階程式設計（上）

1.使用__slots__ 正常情況下，當我們定義了一個class，建立了一個class的例項後，我們可以給該例項繫結任何屬性和方法，這就是動態語言的靈活性。先定義class：

Python爬蟲技術--基礎篇--面向物件高階程式設計（中）

1.多重繼承繼承是面向物件程式設計的一個重要的方式，因為通過繼承，子類就可以擴充套件父類的功能。

程式設計（Python）實驗十五 網路爬蟲基礎 (1)

實驗目的

實驗內容

題目 中國大學排名定向爬蟲

程式碼

相關推薦

程式設計（Python）實驗十五網路爬蟲基礎 (1)

題目中國大學排名定向爬蟲