Python獲取電影天堂各版塊電影

阿新 • • 發佈：2019-01-03

Python獲取電影天堂各版塊電影

版本：

Python3.6.5

引用庫：

re,requests,json,lxml

執行效果：

Python獲取電影天堂各版塊電影

程式碼：

#-*-coding:UTF-8-*-
import re
import requests
import json
from lxml import etree
weburl =r"http://www.ygdy8.net"
def getpage(url): #獲取電影列表頁面數
 t= requests.get(url)
 t.encoding='gbk'
 t=''.join(re.findall("/(d+)條",t.text))
 sum=int(t) // 25
 if int(t) % 25 != 0:
 sum+=1
 return sum
def getlist(url): #獲取電影列表頁各個電影URL
 t=requests.get(url)
 t.encoding='gbk'
 #html = etree.HTML(t.text)
 #murl = html.xpath('//*[@class="ulink"]/@href')
 murl = re.findall('(/html/.*?/.*?/d+/d+.html)" class="ulink"',t.text)
 #mname= html.xpath('//*[@class="ulink"]/text()')
 return murl
def getdownurl(url): #獲取電影頁下載地址
 t = requests.get(url)
 t.encoding = 'gbk'
 if len(re.findall('fdfddf"><a href="(.*?)"',t.text))>0 :
 ftpurl= re.findall('fdfddf"><a href="(.*?)"',t.text)[0]
 return ftpurl
 else:
 return ''
def getdbdata(moivename): #獲取豆瓣評分
 dburl =r"http://api.douban.com/v2/movie/search?q="+moivename
 txt=requests.get(dburl)
 l=json.loads(txt.text)
 #dbid=l["subjects"][0]["id"]
 #dbweburl=l["subjects"][0]["alt"]
 if 'code' in l.keys():
 return -1
 else:
 dbpf=l["subjects"][0]["rating"]["average"]
 return dbpf
def getgf(url): #獲取高評分電影
 for i in range(1,5):
 if i==1:
 t = requests.get(url+'.html')
 else:
 t = requests.get(url +'_'+ str(i) + '.html')
 t.encoding = 'gbk'
 tmp=re.findall('href="(http://www.ygdy8..*?/html/gndy/.*?/d+/d+.html)',t.text)
 for j in tmp:
 durl=getdownurl(j)
 if durl != '':
 name = ''.join(durl).split('.')
 moivename = (name[5] + '[' + name[6] + name[7] + ']')
 dbpf = getdbdata(name[5])
 if dbpf == -1:
 print(moivename,'下載地址：'+ durl)
 else:
 if dbpf > 7.9:
 print(moivename,'豆瓣評分：'+ str(dbpf),'下載地址：'+ durl)
def getmoive(id,page): #獲取指定版塊指定頁數的電影下載地址
 if id < 3:
 pagenum=getpage(url[id]+'1.html')
 if pagenum < page:
 page=pagenum
 for i in range(1,page+1):
 tmpurl=getlist(url[id]+str(i)+'.html')
 k=0
 for j in tmpurl:
 downurl=getdownurl(weburl+j)
 name=''.join(downurl).split('.')
 moivename=(name[5]+'['+name[6]+name[7]+']')
 dbpf=getdbdata(name[5])
 if dbpf == -1:
 print(moivename,'下載地址：'+ downurl)
 else:
 print(moivename,'豆瓣評分：'+str(dbpf),'下載地址：'+downurl)
 k+=1
 else:
 getgf(url[3])
#幾個電影版塊的URL
url = [ #分類名稱 id
 'http://www.ygdy8.net/html/gndy/dyzz/list_23_', #最新電影 0
 'http://www.ygdy8.net/html/gndy/china/list_4_', #國內電影 1
 'http://www.ygdy8.net/html/gndy/oumei/list_7_', #歐美電影 2
 'http://www.ygdy8.net/html/gndy/jddy/20160320/50510'#高分經典 3
]
if __name__=='__main__':
 getmoive(0,3) #getmoive(分類ID,獲取頁數) ps:每頁是25部電影

下面是豆瓣評分查詢無限制時的獲取結果：

Python獲取電影天堂各版塊電影

注：程式碼預設是獲取所有電影的豆瓣評分的，但豆瓣評分的查詢API有時間限制，我在程式碼裡沒有加時間間隔，有需要的自己加一下，再就是如果有更懶的人，就直接用下面的這個吧，簡單粗暴。

Python獲取電影天堂各版塊電影

版本： Python3.6.5 引用庫： re,requests,json,lxml 執行效果：程式碼： #-*-coding:UTF-8-*- import re import requests

python爬取電影天堂網各個電影下載地址

# -*- coding:utf-8 -*- import requests from lxml import etree url="https://www.dy2018.com/html/gndy/dyzz/index.html" response=requests.ge

Python小工具-電影天堂爬取電影下載連結

import requests import bs4 # 獲取單獨的url def movie_info(url): ''' 內容標籤：<div id="Zoom"> 下載連結標籤：--》a標籤屬性：thunderrestitle

爬蟲_電影天堂熱映電影（xpath）

name while 思路 html com ges turn element def 寫了一天才寫了不到100行。不過總歸是按自己的思路完成了 1 import requests 2 from lxml import etree 3 import t

python 抓取電影天堂電影信息放入數據庫

python mysql 電影 # coding:utf-8 import requests from bs4 import BeautifulSoup from multiprocessing import Pool import urllib2 import re import json im

Python獲取全網電影，深夜有小電影看難道不是你學習的初衷嗎？

Python Pythonweb 爬蟲程序員職業你以為這是×××？NO，這只是簡單的Python爬蟲。如今各種各樣的影視Vip收費出現在我們的視野中，對於我們來說也許是一部期待已久的電影電視，可是對於網站，App開發人員來說只是一組數據，為了一組數據去付費、等廣告時間，我覺得還是有

獲取電影天堂電視劇下載頁面所有url地址

電視劇 turn getattr nodes return ret 打印 zoom 換行 /** * Date: 2018/10/1 * Author: xuzhiteng * Description: * 1. 根據標簽獲取最外層元素 * 2. 遍歷獲取出所有鏈接

Python爬取電影天堂

前言：本文非常淺顯易懂，可以說是零基礎也可快速掌握。如有疑問，歡迎留言，筆者會第一時間回覆。本文程式碼存於github 一、爬蟲的重要性：如果把網際網路比喻成一個蜘蛛網，那麼Spider就是在網上爬來爬去的蜘蛛。網路蜘蛛通過網頁的連結地址來尋找網頁，從網站某一個頁面

Python爬取電影天堂最新發布影片訊息

從今天開始我會把我學習python爬蟲的一些心得體會和程式碼釋出在我現在的部落格，好記性不如爛筆頭，以便以後的我進行復習。雖然我現在的爬蟲還很幼小，希望有一天她能長得非常非常的強大。 --------------------2018.11.22--------------------------------

Python爬蟲之模擬登入豆瓣獲取最近看過的電影

哈哈哈，模擬登入成功啦啦啦啦啦~~~~~ 重要的事本來要說三遍，不過還是算了== 先上效果圖：眾所周知，很多網站都設定了登入之後才能獲取檢視頁面的權利，因此模擬登入成了爬取資訊的第一步，這一步

python爬取電影天堂 _上

感謝哈士奇說喵 http://blog.csdn.net/MrLevo520/article/details/51966992 感謝麥子學院麥芽老師 https://www.bilibili.com/video/av18407985/?t=3723 IDE python3

Python抓取電影天堂，零基礎都可以學？原始碼&視訊，大讚！

我知道，大家肯定是看到Python原始碼&視訊教程才進來的。小編說到做到，此次利用Python爬取電影天堂包含視訊教程、以及原始碼。所以說零基礎的Python新手也能夠輕鬆學會，真的一點都不過分。先看我們的部分程式碼與爬取到的結果：爬取到的電影資源：步驟：關於怎麼快速

python爬取電影天堂的下載連結

電影天堂下載連結都是magnet的，搞下來想下就下沒有廣告 # coding=utf-8 import urllib.request #import requests import re import random import json #爬取電影天堂電

Python爬取電影天堂資源

步驟一：python的下載python爬蟲，首先需要本地電腦上安裝有python。首先，進入到python官網，你可以直接輸入python主頁，也可以從百度搜索框進入到python的主頁。然後在主頁上面可以看見Downloads字樣，點選。跳轉出python下載介面，選擇一個

用python做一個可以下載電影天堂最新電影的爬蟲

前段時間剛剛看完了一個很厲害博主寫的爬蟲部落格，怕時間久了自己忘記有關東西，所以今天寫了一個簡單的爬蟲，也滿足一下自己一直對電影天堂的不滿程式碼如下，由於程式碼很少，也沒有涉及動態網頁，所以不過多去做解釋。 # -*- coding:utf-8 -*-

電影天堂獲取電影

from urllib import request import re import pymysql db = pymysql.connect(host='127.0.0.1', user='root', password='123456', port=330

獲取電影天堂的影視連結

import requests from lxml import etree import re headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36

python實現電影天堂種子磁力的爬取

import requests,re def getdetail(url): response = requests.get(url) #dytt的編碼為gbk非utf-8 html = response.content.decode

python 爬取簡單靜態網站之電影天堂

大家好。今天我在這裡與大家分享一下簡單的網頁抓取。一、準備工作：下載並安裝好python3.x，並且配置好環境變數。二、檢查安裝的軟體是否可用：在cmd視窗下分別輸入python -V 命令與 pip -V命令（注意大小寫）若出現版本資訊即表示安裝

團隊-張文然-需求分析-python爬蟲分類爬取豆瓣電影信息

工具新的翻頁需求使用 html 頁面應該一個首先要明白爬網頁實際上就是：找到包含我們需要的信息的網址（URL）列表通過 HTTP 協議把頁面下載回來從頁面的 HTML 中解析出需要的信息找到更多這個的 URL，回到 2 繼續其次還要明白：一個好的列表應該：包含

Python獲取電影天堂各版塊電影

相關推薦