爬蟲入門，爬取酷狗歌單top500，簡單爬蟲案例

阿新 • • 發佈：2018-12-16

import requests
from bs4 import BeautifulSoup
import time

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36'
}


def get_info(url):
    wb_data = requests.get(url, headers=headers)
    soup = BeautifulSoup(wb_data.text, 'lxml')
    ranks = soup.select('span.pc_temp_num')
    titles = soup.select('div.pc_temp_songlist > ul > li > a')
    times = soup.select('span.pc_temp_tips_r > span')
    for rank, title, time in zip(ranks, titles, times):
        data = {
            'rank': rank.get_text().strip(),
            'singer': title.get_text().split('-')[0],
            'song': title.get_text().split('-')[-1],
            'time': time.get_text().strip()
        }
        print(data)


if __name__ == '__main__':
    urls = ['http://www.kugou.com/yy/rank/home/{}-8888.html'.format(str(i)) for i in range(1, 24)]
    for url in urls:
        get_info(url)
        time.sleep(1)

（1）

匯入程式需要的庫，

Requests庫用於請求網頁

獲取網頁資料。

BeautifulSoup用於解析網

頁數據。time庫的sleep()

方法可以讓程式暫停。

（2）

通過Chrome瀏覽器的開發者工具，複製User-Agent，用於偽裝為瀏覽器，便於爬蟲的穩定性。

（3）

定義get_info()函式，用於獲取網頁資訊並輸出資訊。

（4）

為程式的主入口。

爬蟲入門，爬取酷狗歌單top500，簡單爬蟲案例

import requests from bs4 import BeautifulSoup import time headers = { 'User-Agent': 'Mozilla/5.0

java實現爬蟲，爬取網易歌單資訊

之前一直對爬蟲很好奇，覺得它很神祕，而我有個朋友是做爬蟲的，最近有空就向他學習了一下，並試著寫了個小程式。首先是獲得httpclient物件及httpresponse物件，此兩者是用於傳送請求及接受資料。 CloseableHttpClient httpClient

爬蟲程式2-爬取酷狗top500

爬取的內容為酷狗榜單中酷狗top500的音樂資訊，如圖所示。網頁版酷狗不能手動翻頁，進行下一步的瀏覽。但通過觀察第一頁的URL： http://www.kugou.com/yy/rank/home/1-8888.html 這裡嘗試把數字1換為數字2，進行瀏覽，恰好返回的是第2頁的資訊（下圖）。進行

PHPCrawl爬蟲庫抓取酷狗歌單

爬蟲抓取酷狗最近一月精選歌曲。由於抓取的資料量較小，所以沒有考慮多程序什麼的，不過我看了一下PHPCrawl的文件，發現PHPCrawl庫已經把我能想到的功能都封裝好了，實現起來很方便<?phpheader("Content-type:text/html;charset

Java爬蟲系列之實戰：爬取酷狗音樂網 TOP500 的歌曲(附原始碼)

在前面分享的兩篇隨筆中分別介紹了HttpClient和Jsoup以及簡單的程式碼案例： Java爬蟲系列二：使用HttpClient抓取頁面HTML Java爬蟲系列三：使用Jsoup解析HTML 今天就來實戰下，用他們來抓取酷狗音樂網上的 Top500排行榜音樂。接下來的程式碼

【爬蟲入門5】爬取酷狗TOP500

#coding utf-8 import time import requests from bs4 import BeautifulSoup class spider_KG_top500(object): def __init__(self):

[Python爬蟲]爬蟲例項:爬取酷狗TOP500的資料

根據書籍《從零開始學Python網路爬蟲》P41，綜合案例2—爬取酷狗TOP500的資料修改而來. 使用模組requests和模組BeautifukSoup進行爬取. 不得不說，酷狗拿來跑爬蟲真是好，不ban不限制IP~ 要爬取的頁面資訊酷狗TOP500 需要爬

python爬蟲——爬取酷狗音樂top500(BeautifulSoup使用方法)

酷狗音樂Top500 進入，並按F12開啟開發者工具（本文以火狐瀏覽器為例）我們開始審查元素，在檢視器中觀察網頁原始碼，或者右鍵檢視頁面原始碼，看原始碼中是否有我們想要的資訊。我們可以在這裡看到歌單資訊，在ul標籤下正好有22條li個標籤，

java 爬蟲爬取酷狗歌手資料

記錄防止忘記包： jsoup-1.4.1 html解析 httpcore-4.0.1_1 httpclient-4.0.1 程式碼：已經訪問的url佇列 //已經訪問連結佇列 public class VisitedUrlQueue { public static

爬取酷狗音樂華語新歌榜前100

imp bs4 pan indexer quest 爬取 app gui 元素 import requests import time import lxml from bs4 import BeautifulSoup headers = { ‘User-Agen

Python爬蟲入門 | 4 爬取豆瓣TOP250圖書信息

Python 編程語言 Python爬蟲先來看看頁面長啥樣的:https://book.douban.com/top250 我們將要爬取哪些信息：書名、鏈接、評分、一句話評價……1. 爬取單個信息我們先來嘗試爬取書名，利用之前的套路，還是先復制書名的xpath：得到第一本書《追風箏的人》的書名xpath如下：

爬取酷狗音樂Top500

TP pid 標準 html IT 行緩沖瀏覽器輕松 port 開發環境：windows環境+python3+requests庫(請求)+BeautifulSoup庫(解析) 目標:爬取酷狗音樂Top500並保存到txt中整個案例源代碼： #導入程序需要的庫，req

Python爬蟲入門 | 5 爬取小豬短租租房信息

圖片交流 ffffff 信息 jpg http 而已基本 mat 小豬短租是一個租房網站，上面有很多優質的民宿出租信息，下面我們以成都地區的租房信息為例，來嘗試爬取這些數據。小豬短租（成都）頁面：http://cd.xiaozhu.com/1.爬取租房標題按照慣例，

Python 爬蟲入門(一)——爬取糗百

upa ext win comment 地址 odi 批量爬蟲程序 article 爬取糗百內容 GitHub 代碼地址https://github.com/injetlee/Python/blob/master/qiubai_crawer.py 微信公眾號：【智能制造專

Python 爬蟲入門之爬取妹子圖

Python 爬蟲入門之爬取妹子圖來源：李英傑連結： https://segmentfault.com/a/1190000015798452 聽說你寫程式碼沒動力？本文就給你動力，爬取妹子圖。如果這也沒動力那就沒救了。 GitHub 地址:&

python 學習 - 爬蟲入門練習爬取鏈家網二手房資訊

import requests from bs4 import BeautifulSoup import sqlite3 conn = sqlite3.connect("test.db") c = conn.cursor() for num in range(1,101): url = "h

爬蟲入門之爬取靜態網頁表格資料

我們的目標就是將這個表格中的資料爬下來儲存成csv檔案目標連結:http://www.zuihaodaxue.cn/zuihaodaxuepaiming2018.html 內容解析部分我更喜歡使用Pyquery 你也可以使用其他的解析方式 #!/usr/bin/env py

python爬蟲入門之爬取小說.md

新手教學：用Python爬取小說我們在學習Python之餘總想著讓其更具趣味性，可以更好地學習。下面我將講解如何去從網站中爬取我們想看的小說。讓我們枯燥無聊的學習生涯稍微多些趣味。需要只是一點點對requests庫、Beautiful庫及python基礎知識

Python爬蟲入門（爬取某網頁財經部分股票資料）

1：反思部分之前上學期也是看過一點點爬蟲的東西，然後時間太久了也基本哪裡學的又還給哪裡了。然後這兩週的時間被班主任的要求下開始一點一點接觸爬蟲，開始的時候覺的很害怕。可能是因為我這個人的性格，對於未接觸過的事物總有一些莫名的恐懼感，而且之前做東西總習慣了旁邊

Python爬取酷狗TOP100

import time import requests from bs4 import BeautifulSoup headers={ 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537

爬蟲入門，爬取酷狗歌單top500，簡單爬蟲案例

相關推薦