02、書店尋寶（一）

阿新 • • 發佈：2019-04-11

spa 分類 style parse rom htm item 位置 all

你需要爬取的是網上書店Books to Scrape中所有書的分類類型，並且將它們打印出來。它的位置就在網頁的左側，如：Travel，Mystery，Historical Fiction…等。網頁URL:http://books.toscrape.com/

 1 #2、書店尋寶（一）
 2 #    你需要爬取的是網上書店Books to Scrape中所有書的分類類型，並且將它們打印出來。
 3 #    它的位置就在網頁的左側，如：Travel，Mystery，Historical Fiction…等。
 4 
 #    網頁URL:http://books.toscrape.com/
 5 
 6 import requests
 7 from bs4 import BeautifulSoup
 8 res = requests.get(‘http://books.toscrape.com/‘)
 9 html = res.text
10 soup = BeautifulSoup(html,‘html.parser‘)
11 items = soup.find(‘ul‘,class_=‘nav nav-list‘).find(‘li‘).find_all(‘li‘)
12 
13 for item in 
 items:
14     print(item.find(‘a‘).text.strip())
15     print(item.find(‘a‘).text.replace(‘\n‘,‘‘).replace(‘ ‘,‘‘))
16 
17 ‘‘‘
18 執行結果如下：
19 Travel
20 Mystery
21 HistoricalFiction
22 SequentialArt
23 Classics
24 Philosophy
25 ‘‘‘

items中每個Tag的內容如下

1 <li>
2 <a href 
="catalogue/category/books/crime_51/index.html">
3 
4     Crime
5 
6 </a>
7 </li>

02、書店尋寶（一）

spa 分類 style parse rom htm item 位置 all 你需要爬取的是網上書店Books to Scrape中所有書的分類類型，並且將它們打印出來。它的位置就在網頁的左側，如：Travel，Mystery，Historical

03、書店尋寶（二）

little port 裏的 gre there bonding 組成 primary bsp 題目要求：你需要爬取的是網上書店Books to ScrapeTravel這類書中，所有書的書名、評分、價格三種信息，並且打印提取到的信息。網頁U

nyoj 82迷宮尋寶（一）

ret 接下來 set class 但是 ios char pre 移動迷宮尋寶（一）時間限制：1000 ms | 內存限制：65535 KB 難度：4 描述一個叫ACM的尋寶者找到了一個藏寶圖，它根據藏寶圖找到了一個迷宮，這是一個很特別的迷宮，迷宮裏有N個編過號

NYOJ 82 迷宮尋寶（一） (BFS)

迷宮尋寶（一）時間限制： 1000 ms | 記憶體限制： 65535 KB 難度： 4 描述一個叫ACM的尋寶者找到

[luoguP1076] 尋寶（模擬）

記錄 urn efi nbsp show while org tdi tar 傳送門模擬就好！然後需要把一圈的有樓梯的都記錄一下，取膜亂搞。代碼 #include <cstdio> #include <iostream>

（轉載）【項目管理和構建】——Maven下載、安裝和配置（一）

文檔 port 目標軟件項目管理 strong mar temp mave work 原文鏈接： http://blog.csdn.net/jiuqiyuliang/article/details/41076215 在現實

三、內核啟動（一）

ddc 解壓縮 star m283 using 獲得 eterm obj cmode 　　內核的實際起始函數為 start_kernel() 函數，然後再調用其他函數來執行啟動。再調用此函數之前，需要先將通過編譯內核獲得的 zImage 進行解壓，請按成頁目錄構建等基本任務

Python練習之基礎語法、數據類型、字符編碼、文件操作（一）

AD 編碼基礎 orm 分享基本知識 mage fff pos 最近做了幾道練習題，用的都是一些python的基本知識，但每道題都有層次，需要紮實的基礎功底。第一道基礎需求：讓用戶輸入用戶名密碼認證成功後顯示歡迎信息輸錯三次後退出程序升級需求：可以支持多

整合學習之boosting，Adaboost、GBDT 和 xgboost（一）

在前面的部落格（https://blog.csdn.net/qq_16608563/article/details/82878127）介紹了整合學習的bagging方法及其代表性的隨機森林。此次接著介紹整合學習的另一個方法boosting以及boosting系列的一些演算法，具體包括 Ad

Delphi中Chrome Chromium、Cef3學習筆記（一）

原文 http://blog.csdn.net/xtfnpgy/article/details/46635225 官方下載地址：https://cefbuilds.com/ CEF

C++ XML的建立、讀取和修改（一）

跟C#不太一樣，需要呼叫一個TinyXML庫來生成XML，庫的原始碼地址為https://github.com/leethomason/tinyxml2，找到“clone or down”進行下載，，解壓之後，將tinyxml2.h 和 tinyxml2.cpp放入工程檔案中，呼

02分散式協調服務-zookeeper（一）

分散式協調服務-zookeeper 分散式環境的特點分散式環境下面臨的問題經典的CAP/BASE理論 CAP BASE 初步認識zookeeper zookeeper是什麼 zookeeper能做什麼

第四單元目錄檔案的瀏覽、管理及維護（一）

第四單元目錄檔案的瀏覽、管理及維護（一） Linux檔案系統的層次結構 Linux檔案系統的樹狀結構目錄是什麼頂層根目錄的表示檔案系統中的兩個特殊目錄 Linux系統中的一些重要的目錄 bin目錄 sbin目錄家目錄 dev目錄 etc目錄掛載目錄/media或/mnt 其他常用目錄絕對和相對

第四單元目錄文件的瀏覽、管理及維護（一）

組織找到執行文件斜線相對創建根目錄 color 超級第四單元目錄文件的瀏覽、管理及維護（一） Linux文件系統的層次結構 Linux文件系統的樹狀結構目錄是什麽頂層根目錄的表示文件系統中的兩個特殊目錄 Linux系統中的一些重要的目錄 bin目錄 s

Java 連結串列-最基礎的動態資料機構：連結串列的建立、頭部新增元素、尾部新增元素（一）筆記

Java 連結串列-最基礎的動態資料機構優點:真正的動態,不需要處理固定容量的問題缺點：喪失了隨機訪問的能力陣列最好用於索引的情況（最大的優點：支援快速查詢）連結串列不適合用於索引的情況（最大的優點：動態）新增元素如果是在頭部新增那麼直接把元素指向原來頭部，然後

Sybase的安裝、配置及使用（一）

第一章資料庫安裝系統環境：作業系統：win7。資料庫 Sybase 12.5.3。 1.解壓ase1252_de_win.zip 2.進入目錄ase1252_de_win,點選setup.exe

搭建 webpack、react 開發環境（一）

基本介紹 Webpack 是一個前端資源載入/打包工具。它將根據模組的依賴關係進行靜態分析，然後將這些模組按照指定的規則生成對應的靜態資源，它可以將多種靜態資源 JavaScript、css、less 等轉換成一個靜態檔案，減少了頁面的請求。 React

linux-Centos-7-64位：9、session同步共享（一）

一、第一種方案基於Nginx+Tomcat叢集的Session共享在Linux環境下第一步：下載對應的nginx 和 tomcat 包並解壓、安裝、配置（此步驟之前文章有提過，在此省略。。）第二步：Linux下nginx配置 #Nginx所用使用者和組，

阿里雲播放器SDK的正確開啟方式 | 功能、架構與應用（一）

阿里雲播放器SDK（ApsaraVideo for Player SDK）是阿里視訊雲端到雲到端服務的重要一環，除了支援點播和直播的基礎播放功能外，還深度融合視訊雲業務，支援視訊的加密播放、安全下載、首屏秒開、低延時等業務場景，為使用者提供簡單、快速、安全、穩定的視訊播放

python-tkinter模組圖形繪製、移動小程式（一）

圖形視窗顯示按鈕，標籤： # 簡單GUI（圖形使用者介面）示例 from tkinter import * def main(): tk = Tk('123') label = Label(tk,text = '歡迎來到python tkinter') #

02、書店尋寶（一）

相關推薦