python爬蟲之音樂下載

阿新 • • 發佈：2019-01-22

使用爬蟲實現音樂下載

需要用到以下幾點內容

requests請求
檔案操作
一點點正則表示式

首先，分析我們要爬取的網站，這裡用到的是好聽輕音樂網，

第一步，選擇任意一首歌點選加號，新增到列表。

2.第二步，多新增幾首，開啟開發者工具，播放下一首，會發現，network中多了一個5的資源包

3. 滑鼠右鍵點選這個資源包，copy->copy link dress, 在新視窗中開啟，發現這個就是那個音樂。

我這得到的是這個url地址，http://f2.htqyy.com/play7/55/mp3/5，再切換另一首歌曲，得到http://f2.htqyy.com/play7/261/mp3/5。發現規律沒有，http://f2.htqyy.com/play7/{ }

/mp3/5 黑色背景部分為變動部分，其餘不變，下面的任務就是找出每首歌對應的數字。

4.在首頁，點選熱播榜更多（這裡舉例）

發現這裡有很多很多頁，如果想把這幾頁都下載下來怎麼辦，開啟開發者工具，點選第二頁，發現network裡多了一個資源包

滑鼠右鍵點選這個資源包，copy->copy link dress, 在新視窗中開啟，點選紅色圈中的部分，然後點選歌名，可以看到每首歌對應的數字 sid=‘4’例如水邊的阿狄麗娜對應的是http://f2.htqyy.com/play7/4/mp3/5。得到了每首歌的url。

5. 得到每一頁的url ，開啟第二頁的url為

http://www.htqyy.com/top/musicList/hot?pageIndex=1&pageSize=20

開啟第一頁的url為，

http://www.htqyy.com/top/musicList/hot?pageIndex=0&pageSize=20

得到通式：http://www.htqyy.com/top/musicList/hot?pageIndex={ }&pageSize=20

黑色部分為頁碼從0開始

通過以上分析，得知如果想下載音樂的話必須先找到其對應的url，然後再進行二進位制檔案的寫操作

程式碼如下：

import re   # python 的正則庫
import requests     # python 的requests庫

songId = []         # 用來儲存每首歌對應的數字
songName = []       # 用來儲存每首歌的名字

# 這裡先下載5頁的歌曲
for n in range(0, 5):
    # 字串的格式化 n 代替 {}
    url = 'http://www.htqyy.com/top/musicList/hot?pageIndex={}&pageSize=20'.format(n)
    print(url, end='\n')
    # 模擬瀏覽器請求，拿到html程式碼
    html = requests.get(url)
    # 用正則表示式捕獲 數字， （）內為捕獲的內容 .*? 為任何內容
    resultId = re.findall('sid="(.*?)">', html.text)
    # 用正則表示式捕獲 歌名
    resultName = re.findall('<a href=".*?" target="play" title="(.*?)" sid=".*?">', html.text)
    # 存進陣列
    songId.extend(resultId)
    songName.extend(resultName)
print(songId)
print(songName)


for m in range(0, len(songId)):
    # 字串的格式化 m 代替 {}
    songUrl = 'http://f2.htqyy.com/play7/{}/mp3/5'.format(songId[m])
    print(songUrl, end='\n')
    print('正在下載第{}首。。。'.format(m+1))
    # 得到返回資源的內容
    response = requests.get(songUrl).content
    # 以二進位制的形式寫入檔案中
    f = open('E:\\music\\{}.mp3'.format(songName[m]), 'wb')
    f.write(response)
    f.close()

有什莫疑問，咱們可以一起探討，敬請留言

python爬蟲之音樂下載

使用爬蟲實現音樂下載需要用到以下幾點內容 requests請求檔案操作一點點正則表示式首先，分析我們要爬取的網站，這裡用到的是好聽輕音樂網，第一步，選擇任意一首歌點選加號，新增到列表。2.第二步，多新增幾首，開啟開發者工具，播放下一首，會發現，network中多了

小白都懂的Python爬蟲之網易雲音樂下載

微信又改版了，為了方便第一時間看到我們的推送，請按照下列操作，設定“置頂”：點選上方藍色字型“程

python爬蟲之scrapy文件下載

files 下載 item toc mat spider color pid 一點我們在寫普通腳本的時候，從一個網站拿到一個文件的下載url，然後下載，直接將數據寫入文件或者保存下來，但是這個需要我們自己一點一點的寫出來，而且反復利用率並不高，為了不重復造輪子，scra

Python爬蟲之多線程下載豆瓣Top250電影圖片

process current ocs code roc 輸出 wait div 允許爬蟲項目介紹 ??本次爬蟲項目將爬取豆瓣Top250電影的圖片，其網址為：https://movie.douban.com/top250，具體頁面如下圖所示： ??本次爬蟲項目將分別

python爬蟲之下載檔案的方式總結以及程式例項

python爬蟲之下載檔案的方式以及下載例項目錄第一種方法：urlretrieve方法下載第二種方法：request download 第三種方法：視訊檔案、大型檔案下載實戰演示第一種方法：urlretrieve方法下載

python爬蟲之騰訊視訊vip下載

執行環境 IDE：pycharm python：3.6.5 實現目的實現對騰訊視訊目標url的解析與下載，由於第三方vip解析，只提供線上觀看，隱藏想實現對目標視訊的下載實現思路首先拿到想要看的騰訊電影url,通過第三方vip視訊解析網

python爬蟲之下載京東頁面圖片

pen 縮小 use window com link_list sel class 模擬瀏覽器 import requests from bs4 import BeautifulSoup import time import re t = 0 #用於給圖片命名 for

python 爬蟲之requests爬取頁面圖片的url，並將圖片下載到本地

大家好我叫hardy 需求：爬取某個頁面，並把該頁面的圖片下載到本地思考：　　img標籤一個有多少種類型的src值？三種：1、以http開頭的網路連結。2、以“/”開頭絕對路徑。3、以“./”開頭相對路徑。當然還有其他型

一個鹹魚的Python爬蟲之路（三）：爬取網頁圖片

you os.path odin 路徑生成存在 parent lose exist 學完Requests庫與Beautifulsoup庫我們今天來實戰一波，爬取網頁圖片。依照現在所學只能爬取圖片在html頁面的而不能爬取由JavaScript生成的圖。所以我找了這個網站

[Python爬蟲] 之十五：Selenium +phantomjs根據微信公眾號抓取微信文章

頭部 drive lac 過程標題操作函數軟件測試 init 　　借助搜索微信搜索引擎進行抓取　　抓取過程　　1、首先在搜狗的微信搜索頁面測試一下，這樣能夠讓我們的思路更加清晰　　　　　　在搜索引擎上使用微信公眾號英文名進行“搜公眾號&r

玩轉python爬蟲之URLError異常處理

bsp 無法識別 pac 使用 cin lai 網絡處理方式地址這篇文章主要介紹了python爬蟲的URLError異常處理，詳細探尋一下URL\HTTP異常處理的相關內容，通過一些具體的實例來分析一下，非常的簡單，但是卻很實用，感興趣的小夥伴們可以參考一下本節

python爬蟲之正則表達式

ner cde 輸入 set 神奇 tro 轉義規則 error 一、簡介　　正則表達式，又稱正規表示式、正規表示法、正規表達式、規則表達式、常規表示法（英語：Regular Expression，在代碼中常簡寫為regex、regexp或RE），計算機科學的一個概念。

[Python爬蟲] 之十九：Selenium +phantomjs 利用 pyquery抓取超級TV網數據

images 判斷 nco dex onf etc lac lin 利用　　一、介紹　　　　本例子用Selenium +phantomjs爬取超級TV（http://www.chaojitv.com/news/index.html）的資訊信息，輸入給定關鍵字抓取

Python爬蟲之爬取煎蛋網妹子圖

創建目錄 req add 註意 not 相同 esp mpi python3 這篇文章通過簡單的Python爬蟲（未使用框架，僅供娛樂）獲取並下載煎蛋網妹子圖指定頁面或全部圖片，並將圖片下載到磁盤。首先導入模塊：urllib.request、re、os import

python爬蟲之git的使用

mage .cn 沒有倉庫本地倉庫 odin src python爬蟲建立 1、初始化文件夾為版本控制文件夾，首先建立一個文件夾，進入這個文件夾以後輸入git init初始化這個文件夾。 2、Git幾種位置概念 1、本地代碼：本地更改完代碼以後，雖然是存放在git的

python爬蟲之git的使用（coding.net的使用）

git push github上版本 es2017 push 我們執行命令 pytho 最好的 1、註冊coding.net賬號，然後登陸。 2、創建項目套路和github都一樣。 1.1、我們在遠程倉庫上創建了一個倉庫，這樣的話，我們需要在本地隨便建立一

python爬蟲之requests模塊

.post 過大 form表單提交 www xxxxxx psd method date .com 一. 登錄事例 a. 查找汽車之家新聞標題鏈接圖片寫入本地 import requests from bs4 import BeautifulSoup import

Python爬蟲之利用正則表達式爬取內涵吧

file res start cnblogs all save nts quest ide 首先，我們來看一下，爬蟲前基本的知識點概括一. match()方法：這個方法會從字符串的開頭去匹配（也可以指定開始的位置），如果在開始沒有找到，立即返回None，匹配到一個結果

Python爬蟲之利用BeautifulSoup爬取豆瓣小說（三）——將小說信息寫入文件

設置 one 行為 blog 應該 += html uil rate 1 #-*-coding:utf-8-*- 2 import urllib2 3 from bs4 import BeautifulSoup 4 5 class dbxs: 6 7

python爬蟲之scrapy的pipeline的使用

python爬蟲 pre ram .py pid cati port 目錄自動創建 scrapy的pipeline是一個非常重要的模塊，主要作用是將return的items寫入到數據庫、文件等持久化模塊，下面我們就簡單的了解一下pipelines的用法。案例一：　　

python爬蟲之音樂下載

使用爬蟲實現音樂下載

需要用到以下幾點內容

相關推薦