資料採集與融合技術_實驗一

阿新 • • 發佈：2021-10-02

作業①：

1）大學軟工排名資訊的爬取

– 要求：用urllib和re庫方法定向爬取給定網址https://www.shanghairanking.cn/rankings/bcsr/2020/0812的資料。
– 輸出資訊：

2020排名	全部層次	學校名稱	總分
1	前2%	清華大學	1661.0

完成過程：
1.向頁面傳送請求，獲取原始碼：

2.利用正則表示式匹配資料並存入相應列表：

3.處理列表元素並列印：

4.結果展示：

2）心得體會：此次作業老師只允許使用urllib和re庫定向爬取網址，這對我們的正則表示式的使用熟練度有一定的要求。
所以通過這次實驗我對正則表示式的理解更加的清晰，使用也更加的熟練。

作業②

1）城市實時空氣質量資訊的爬取
– 要求：用requests和Beautiful Soup庫方法設計爬取https://datacenter.mee.gov.cn/aqiweb2/AQI實時報。
– 輸出資訊：

序號城市 AQI PM2.5 SO2 NO2 CO 首要汙染物

1 北京市 55 6 5 1.0 225 ——

完成過程：
1.向頁面傳送請求，獲取原始碼：

2.建立soup物件，匹配相應td節點

3.列印節點資訊

4.結果展示：

2）心得體會：這題老師要求使用requests和Beautiful Soup庫方法設計爬取網址資訊。
通過此題的完成，我明白了Beautiful Soup庫方法使用的便利，也熟練的掌握了css語法操作，同時也更加熟練的使用requests庫的方法。
作業③

1）福大新聞網圖片的爬取
– 要求：使用urllib和requests和re爬取一個給定網頁https://news.fzu.edu.cn/爬取該網站下的所有圖片
– 輸出資訊：將自選網頁內的所有jpg檔案儲存在一個資料夾中

完成過程（urllib庫）：
1.向頁面傳送請求，獲取原始碼：

2.利用正則表示式匹配並獲取圖片下載連結：

3.下載圖片：

完成過程（requests庫）：
1.向頁面傳送請求，獲取原始碼：

2.利用正則表示式匹配圖片下載連結：

3.下載圖片：

4.結果展示：

2）心得體會：此題老師要求使用urllib和requests和re庫爬取一個給定網址的圖片資訊。
通過此題實踐，我掌握了從網頁上儲存圖片至本地的urllib方法和requests方法，同時也對正則表示式的使用更加的熟練。
附錄

三題完整程式碼

資料採集與融合技術_實驗一

作業①： 1）大學軟工排名資訊的爬取 – 要求：用urllib和re庫方法定向爬取給定網址https://www.shanghairanking.cn/rankings/bcsr/2020/0812的資料。

資料採集與融合技術_實驗3

作業①： 1）中國氣象網圖片的爬取 – 要求：要求：指定一個網站，爬取這個網站中的所有的所有圖片，例如中國氣象網（http://www.weather.com.cn）。

資料採集與融合技術_實驗四

碼雲連結：歐翔實驗四 1.作業①: 要求：熟練掌握 scrapy 中 Item、Pipeline 資料的序列化輸出方法；Scrapy+Xpath+MySQL資料庫儲存技術路線爬取噹噹網站圖書資料

資料採集與融合技術_實踐2

任務①: 要求：在中國氣象網（http://www.weather.com.cn）給定城市集的7日天氣預報，並儲存在資料庫。

資料採集與融合技術_實踐5

作業①: 要求：熟練掌握 Selenium 查詢HTML元素、爬取Ajax網頁資料、等待HTML元素等內容。

資料採集與融合技術實驗1

作業①：要求：用urllib和re庫方法定向爬取給定網址（https://www.shanghairanking.cn/rankings/bcsr/2020/0812 ）的資料

資料採集與融合技術-實驗1

作業①：要求：用urllib和re庫方法定向爬取給定網址（https://www.shanghairanking.cn/rankings/bcsr/2020/0812 ）的資料

資料採集與融合技術-實驗二

作業①：我的Gitee 要求：在中國氣象網（http://www.weather.com.cn）給定城市集的7日天氣預報，並儲存在資料庫。

資料採集與融合技術——實驗三

作業① 要求：指定一個網站，爬取這個網站中的所有的所有圖片，例如中國氣象網（http://www.weather.com.cn）。分別使用單執行緒和多執行緒的方式爬取。(限定爬取圖片數量為學號後3位)

資料採集與融合技術實驗5

作業①：要求：熟練掌握 Selenium 查詢HTML元素、爬取Ajax網頁資料、等待HTML元素等內容。

資料採集與融合技術第二次實踐

第二次作業作業① 要求：在中國氣象網（http://www.weather.com.cn）給定城市集的7日天氣預報，並儲存在資料庫。

資料採集與融合技術第五次實踐

資料探勘第五次實踐作業一京東資訊爬取實驗作業內容要求：熟練掌握 Selenium 查詢HTML元素、爬取Ajax網頁資料、等待HTML元素等內容。使用Selenium框架爬取京東商城某類商品資訊及圖片。

資料採集與融合實驗2

作業①：要求：在中國氣象網（http://www.weather.com.cn）給定城市集的7日天氣預報，並儲存在

【資料採集與融合】第四次實驗

作業一噹噹圖書爬取實驗作業內容要求：熟練掌握 scrapy 中 Item、Pipeline 資料的序列化輸出方法； Scrapy+Xpath+MySQL資料庫儲存技術路線爬取噹噹網站圖書資料

【資料採集與融合】第五次實驗

資料探勘第五次實踐作業一京東資訊爬取實驗作業內容要求：熟練掌握 Selenium 查詢HTML元素、爬取Ajax網頁資料、等待HTML元素等內容。使用Selenium框架爬取京東商城某類商品資訊及圖片。

【資料採集與融合】第二次實踐

作業① 1.1作業內容要求：在中國氣象網（http://www.weather.com.cn）給定城市集的7日天氣預報，並儲存在資料庫

20192418張曦 2021-2022-2 《網路與系統攻防技術》實驗一實驗報告

20192418張曦 2021-2022-2 《網路與系統攻防技術》實驗一實驗報告一、實驗內容本次實踐的物件程式是一個名為pwn20192418的linux可執行檔案。

20192419 2021-2022-2 《網路與系統攻防技術》實驗一實驗報告

1.實驗內容本次實驗主要是對一個在Linux的可執行檔案進行緩衝區溢位攻擊。這個可執行程式包含有兩個程式碼段：

20192430 2021-2022-2 《網路與系統攻防技術》實驗一實驗報告

一、實驗內容實驗物件:Linux可執行檔案pwn20192430 程式正常執行：main函式呼叫foo函式，列印輸入的字串

20192420 任文朗 2021-2022-2 《網路與系統攻防技術》實驗一實驗報告

實驗一逆向破解與BOF 目錄實驗一逆向破解與BOF 一、實踐內容 1.1 具體內容 1.2 對應的實際操作場景