Python3簡單爬蟲之下載相關型別音樂（喜馬拉雅網站）

阿新 • • 發佈：2019-02-10

一，簡單介紹python

1.眾所周知，python在近幾年可以說是非常火爆，在受歡迎排名上經常位於前列

2017年IEEE Spectrum 最新的研究報告

2018年TIOBE 剛剛釋出了 6 月程式語言排行榜

2.百科簡單介紹

Python是一種面向物件的解釋型計算機程式設計語言，由荷蘭人Guido van Rossum於1989年發明，第一個公開發行版發行於1991年。

Python具有豐富和強大的庫。它常被暱稱為膠水語言，能夠把用其他語言製作的各種模組(尤其是C/C++)很輕鬆地聯結在一起。等等。

3.python優勢及推薦視訊

Python相對於其他語言有以下的優勢：

1、Python易於學習

2、Python

讓你能用少量的程式碼構建出更多的功能

3. Python是一門多才多藝的語言，似乎每個領域都可以使用：系統操作，Web開發，部署，科學建模等，大抵找不出第二個更多才多藝的語言了。

4.Python擁有最成熟的程式包資源庫之一

5.Python在資料科學領域被廣泛使用

Python教學視訊：

1. 騰訊課堂上的馬哥教育視訊

2. 廖雪峰的python教程網站

3. B站上的python視訊（小甲魚零基礎入門學習）

4. 有問題也可以上部落格知乎等查詢資料

二，爬蟲過程（抓取喜馬拉雅網站的音樂並下載在資料夾上）

1.實驗環境

win10，pycharm，python3.6，火狐瀏覽器

2.新增相關庫

開啟pycharm

點選設定

點選專案直譯器，再點選右邊+號

搜尋相關庫並新增，例如：requests

新建檔案

用火狐瀏覽器開啟喜馬拉雅網站，再點選音樂，可以得到喜馬拉雅音樂模組的url

點選流行和搖滾，我們可以觀察並發現https://www.ximalaya.com/yinyue/與搜尋內容拼音組合即使是搜尋結果的url

然後我們發現未點選播放時抓取的資訊的頁面：

點選播放後的頁面：

所以我們會發現多出get方法的一個json檔案

觀察上面兩張圖片：瀏覽這個json

並在瀏覽器開啟這個網址：

https://www.ximalaya.com/revision/play/album?albumId=391242&pageNum=1&pageSize=30

觀察可知，可以看到albumId，還有音訊檔案url：

"http://audio.xmcdn.com/group12/M03/2C/AA/wKgDW1WJ7GqxuItqAB8e1LXvuds895.m4a"

訪問搜尋介面的原始碼，查詢albumId，通過這些albumid獲取音訊檔案的url

最後使用函式urllib.request.urlretrieve（）下載音樂

效果如下：

資料夾裡下載好的歌曲：

具體程式碼：

import requests
import re        #正則表示式
import urllib   #下載音樂的庫
from pypinyin import pinyin, lazy_pinyin
import pypinyin         #轉為拼音的庫
header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0'} ##偽裝成瀏覽器
def Pinyin(search):       #輸入要查詢的內容0
l=lazy_pinyin(search)   #字串轉化為拼音
str1 = "".join(l)
    return str1

def SearchHtml(str,header):             #獲取搜尋得到的html
url= 'https://www.ximalaya.com/yinyue/'+str
    #print(url)
html=requests.get(url,headers=header)
    #print(html.status_code)
html.encoding=html.apparent_encoding
    #print(html.text)
return html

#"albumId":3961176,"title":"六喜珠寶-車載音樂 歐美鄉村民謠"
def albumId(html):             #獲取albumId的值 並將albumId與https://www.ximalaya.com/revision/play/album?albumId=組合json的url
d=re.findall(r'"albumId":(.*?),',(html).text)
    url3=[]

    for x in (d[:1]):
        url2='https://www.ximalaya.com/revision/play/album?albumId='+x
        html2=requests.get(url2,headers=header)
#src   "http://audio.xmcdn.com/group12/M03/2C/AA/wKgDW1WJ7GqxuItqAB8e1LXvuds895.m4a"
url3=(re.findall(r'"src":"(.*?)"',(html2).text))
    return url3

def title(html):
    t=re.findall(r'"title":"(.*?)"',(html).text)    #獲取titile（歌名）的值
return t

def Download(url,title):    #下載音樂
n=0
for y in url:
        try:
            print("正在下載——"+str(t[n]))
            urllib.request.urlretrieve(y,r'D:\zachary\喜馬拉雅音樂\\'+str(t[n]+'.m4a'))
            print("下載——"+str(t[n])+"——成功")
            n=n+1
except:
            print("下載——"+str(t[n])+"——失敗")

str1=Pinyin('搖滾')
html=SearchHtml(str1,header)
t=title(html)
url3=albumId(html)
Download(url3,t)

三，結尾

謝謝各位觀看。如有錯誤的地方，非常歡迎大家通知改正。謝謝。

Python3簡單爬蟲之下載相關型別音樂（喜馬拉雅網站）

一，簡單介紹python1.眾所周知，python在近幾年可以說是非常火爆，在受歡迎排名上經常位於前列2017年IEEE Spectrum 最新的研究報告2018年TIOBE 剛剛釋出了 6 月程式語言排行榜2.百科簡單介紹Python是一種面向物件的解釋型計算機程式設計語言

【Python3爬蟲】下載酷狗音樂上的VIP付費歌曲

經過測試，可以下載要付費下載的歌曲（n_n）準備工作：Python3.5+Pycharm 使用到的庫：requests，re，json 步驟：開啟酷狗音樂的官網，輸入想要搜尋的歌曲（例如《天后》），然後回車搜尋，得到如下頁面：右鍵檢查

小白都懂的Python爬蟲之網易雲音樂下載

微信又改版了，為了方便第一時間看到我們的推送，請按照下列操作，設定“置頂”：點選上方藍色字型“程

Python開發簡單爬蟲之靜態網頁抓取篇：爬取“豆瓣電影 Top 250”電影數據

模塊歲月 python開發 IE 女人 bubuko status 公司使用目標：爬取豆瓣電影TOP250的所有電影名稱，網址為：https://movie.douban.com/top250 1）確定目標網站的請求頭：打開目標網站，在網頁空白處點擊鼠標右鍵，

Java爬蟲之下載全世界國家的國旗圖片

stack [] trac node edr string類型微信公眾號 public 過程介紹 ??本篇博客將繼續上一篇博客：Python爬蟲之使用Fiddler+Postman+Python的requests模塊爬取各國國旗的內容，將用Java來實現這個爬蟲，下載

簡單爬蟲之爬取網站圖片

這裡選取的網址是 http://www.doutula.com 目的：爬取其中的圖片並且翻頁爬取首頁圖片的規則 <img src="https://ws3.sinaimg.cn/bmiddle/6af89bc8gw1f

Python爬蟲（一）：編寫簡單爬蟲之新手入門

最近學習了一下python的基礎知識，大家一般對“爬蟲”這個詞，一聽就比較熟悉，都知道是爬一些網站上的資料，然後做一些操作整理，得到人們想要的資料，但是怎麼寫一個爬蟲程式程式碼呢？相信很多人是不會的，今天寫一個針對新手入門想要學習爬蟲的文章，希望對想要學習的你能有所幫助~~廢話不多說，進入正文！

簡單爬蟲之requests的使用

Requests庫的用法安裝 pip install requests 基本請求 response=requests.get(引數) response=requests.post(引數) response=requests.put(

Python編寫簡單爬蟲之新手入門（一）

最近學習了一下python的基礎知識，大家一般對“爬蟲”這個詞，一聽就比較熟悉，都知道是爬一些網站上的資料，然後做一些操作整理，得到人們想要的資料，但是怎麼寫一個爬蟲程式程式碼呢？相信很多人是不會的，今天寫一個針對新手入門想要學習爬蟲的文章，希望對想要學習的你能有所幫助~~廢

python爬蟲之下載檔案的方式總結以及程式例項

python爬蟲之下載檔案的方式以及下載例項目錄第一種方法：urlretrieve方法下載第二種方法：request download 第三種方法：視訊檔案、大型檔案下載實戰演示第一種方法：urlretrieve方法下載

python爬蟲之下載京東頁面圖片

pen 縮小 use window com link_list sel class 模擬瀏覽器 import requests from bs4 import BeautifulSoup import time import re t = 0 #用於給圖片命名 for

node.js爬蟲之下載前端視訊

((resolve)=>{ request(url,(error, response, body)=>{ if (!error && response.statusCode == 200) { var $ =

node.js爬蟲之下載圖片，批量下載圖片，控制下載圖片並行上限

首先介紹一下爬蟲所需要的的包 require(“request”); –get post請求頁面 require(“cheerio”) –解析文字物件為DOM物件也就是說將string 裝換為 js操作的 $() 這種選擇器 require(‘fs’);

7-Python3從入門到實戰—基礎之數據類型（字典-Dictionary）

from ref 不存在 gpo http 必須 ems href int Python從入門到實戰系列——目錄字典的定義字典是另一種可變容器模型，且可存儲任意類型對象；使用鍵-值（key-value）存儲，具有極快的查找速度；字典的每個鍵值(key=>val

自定義控制元件之下載控制元件1（DownloadView1）

前段時間在乾貨集中營看到了兩個炫酷的下載按鈕：可惜是隔壁 iOS 的孩子，怎麼辦，我也好喜歡，emmm，某該，只能自己模仿著實現一下了。先從第一個入手（第二個波浪效果暫時還不會）。 1 準備動作寫過幾次自定義控制元件

Python爬蟲之爬取各大幣交易網站公告——靜態網站.md

Python爬蟲之爬取各大幣交易網站公告——靜態網站瞭解爬蟲之後，我們也漸漸掌握了根據網站的種類選擇不同庫來對其進行處理，提取我們想要的東西。靜態網站，我們往往利用requests庫提取網站html資訊，再通過正則表示式或BeautifulSoup庫提取我們

Python3《機器學習實戰》學習筆記（十二）：線性迴歸提高篇之樂高玩具套件二手價預測

一、前言本篇文章講解線性迴歸的縮減方法，嶺迴歸以及逐步線性迴歸，同時熟悉sklearn的嶺迴歸使用方法，對樂高玩具套件的二手價格做出預測。二、嶺迴歸如果資料的特徵比樣本點還多應該怎麼辦？很顯然，此時我們不能再使用上文的方法進行計算了，因為矩陣X不是滿秩矩

python爬蟲之requests庫詳解（一，如何通過requests來獲得頁面資訊）

前言：爬蟲的基礎是與網頁建立聯絡，而我們可以通過get和post兩種方式來建立連線，而我們可以通過引入urllib庫[在python3的環境下匯入的是urllib；而python2的環境下是urllib和urllib2]或者requests庫來實現,從程式的複雜度和可讀性

Python3.6 爬蟲初體驗--urllib、beautifulsoup（一）

經常查詢IP地址相關，有時目標太多需要批量操作，於是想到python爬蟲，批量查詢、模式輸出，廢話不多說，程式碼奉上！ p.s. 涉及到的兩個主要模組–urllib、BeautifulSoup p.s. 本文主要介紹以上兩模組使用，故涉及到的IP查詢網站就用

Android O CTS 測試之Media相關測試小結（二）

CtsMediaTestCases android.media.cts.VideoDecoderPerfTest failed failed 項：android.media.cts.VideoDecoderPerfTest#testHevcGoog

Python3簡單爬蟲之下載相關型別音樂（喜馬拉雅網站）

一，簡單介紹python

3.python優勢及推薦視訊

二，爬蟲過程（抓取喜馬拉雅網站的音樂並下載在資料夾上）

1.實驗環境

2.新增相關庫

三，結尾

相關推薦