python爬取小視頻,看完身體一天不如一天!
阿新 • • 發佈:2019-04-18
image 規則 page 直接 nag 輸入 python代碼 dad 網頁 Python現在非常火,語法簡單而且功能強大,很多同學都想學Python!所以在這裏給各位看官們準備了高價值Python學習視頻教程及相關電子版書籍,都放在了文章結尾,歡迎前來領取!
python爬取小視頻記錄
學習python簡單爬蟲小程序,記錄代碼和學習過程
環境信息
python 2.7.12
分析與步驟
for i, k in zip(name_items, url_items):
url_name.append([i, k])
#傳入文件名和video地址
def saveVideo(filename,videoUrl):
print ‘Saving : %s ...‘%filename
urllib.urlretrieve(videoUrl,‘D:\video\%s.mp4‘%filename)
####main exec ####
for pageindex in range(1,3):
get(pageindex)
for index,item in enumerate(url_name):
saveVideo(index,item[1])
文末福利
獲取方式:加python群 839383765 即可獲取!
python爬取小視頻記錄
學習python簡單爬蟲小程序,記錄代碼和學習過程
環境信息
python 2.7.12
分析與步驟
- 要分析網站信息 http://www.budejie.com/video/
- 查看網頁不同頁面的信息
http://www.budejie.com/video/2
http://www.budejie.com/video/3
http://www.budejie.com/video/4
可以知道,不同頁面的URL規則,直接在後面輸入數字查看跳轉到不同頁 - 分析視頻內容特點
如圖:
查看網頁代碼:
通過這段代碼,我們可以考慮分析。在python代碼中用一段存放描述內容,一段存放視頻所在的url
對於每個url地址,通過urllib所提供的urlretrieve下載 - 具體代碼實現
-- encoding:utf8 --
import re
import sys
import urllib2
import urllib
import os
reload(sys)
sys.setdefaultencoding("utf-8")
#a = 1
url_name = []
def get(pageindex):
url = ‘http://www.budejie.com/video/‘ + str(pageindex)
var1.set(‘已經獲取到第%s頁的視頻視頻‘%(a))
print url
html = urllib.urlopen(url).read()
url_reg = r‘data-mp4="(.?)"‘
url_items = re.findall(url_reg, html)
name_reg = re.compile(‘<div class="j-r-list-c-desc".?<a href=".?>(.?)</a>.*?</div>‘, re.S)
name_items = re.findall(name_reg, html)
url_name.append([i, k])
#傳入文件名和video地址
def saveVideo(filename,videoUrl):
print ‘Saving : %s ...‘%filename
urllib.urlretrieve(videoUrl,‘D:\video\%s.mp4‘%filename)
####main exec ####
for pageindex in range(1,3):
get(pageindex)
for index,item in enumerate(url_name):
saveVideo(index,item[1])
文末福利
獲取方式:加python群 839383765 即可獲取!
python爬取小視頻,看完身體一天不如一天!