專案練習：電影列表爬蟲

阿新 • • 發佈：2018-12-02

 1 # -*- coding:utf-8 -*-
 2 # Author:Sure Feng
 3 
 4 import requests
 5 import json
 6 
 7 
 8 class DoubanFileSpider(object):
 9     def __init__(self):
10         self.start_tempt_url = [
11             {
12             "url_tempt": "https://movie.douban.com/j/search_subjects?type=movie&tag=%E5%8D%8E%E8%AF%AD&sort=recommend&page_limit=20&page_start={} 
",
13             "country": "cn"
14             }, {
15             "url_tempt": "https://movie.douban.com/j/search_subjects?type=movie&tag=%E6%97%A5%E6%9C%AC&sort=recommend&page_limit=20&page_start={}",
16             "country": "janpan"
17             }, {
18             "url_tempt": " 
https://movie.douban.com/j/search_subjects?type=movie&tag=%E6%AC%A7%E7%BE%8E&sort=recommend&page_limit=20&page_start={}",
19             "country": "usa"
20             }
21         ]
22         self.headers = {
23             "User-Agent": "Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Mobile Safari/537.36 
"}
24 
25     def parse_url(self, url):
26         """傳送請求，獲取響應"""
27         respond = requests.get(url, headers=self.headers)
28         return respond.content.decode()
29 
30     def save_data(self, list_str, country):
31         """儲存資料"""
32         with open("douban.txt", "a", encoding="utf-8") as f:
33             for info_str in list_str:
34                 # print(info_str)
35                 info_str["country"] = country
36                 f.write(json.dumps(info_str, ensure_ascii=False))
37                 f.write("\n")
38 
39     def get_content(self, json_str):
40         """提取資料"""
41         dict_ret = json.loads(json_str)
42         content_list = dict_ret["subjects"]
43         return content_list
44 
45     def run(self):
46         """實現主要邏輯"""
47         for url_tempt in self.start_tempt_url:
48             num = 0
49             country = url_tempt["country"]
50             while True:
51                 # start_url
52                 start_url = url_tempt["url_tempt"].format(num)
53                 print(start_url)
54                 # 傳送請求，獲取響應
55                 json_str = self.parse_url(start_url)
56                 # 提取資料
57                 content_list = self.get_content(json_str)
58                 # 儲存
59                 self.save_data(content_list, country)
60                 # 構造下一頁的URL地址，重複步驟
61                 if len(content_list) < 20:
62                     break
63                 num += 20
64 
65 
66 if __name__ == "__main__":
67     douban_spider = DoubanFileSpider()
68     douban_spider.run()

專案練習：電影列表爬蟲

1 # -*- coding:utf-8 -*- 2 # Author:Sure Feng 3 4 import requests 5 import json 6 7 8 class DoubanFileSpider(object): 9 def __init__(sel

Vue.js學習記錄-14-Vue去哪兒網專案實戰：城市列表頁開發-Alphabet + 細節配置補充

Alphabet：字母表導航條 (增量式) 元件data初始化： name: 'CityAlphabet', props: { cities: Object }, data() { return { touchStatus: fal

Vue.js學習記錄-13-Vue去哪兒網專案實戰：城市列表頁開發-Search + List

Search：城市選擇資訊輸入檢索 (增量式) 功能點2：使用者可以在搜尋欄中可輸入資訊進行城市資訊的檢索，檢索結果以列表形式展現，選定城市後會進行首頁的路由跳轉。功能點2分析：使用者故事角度作為使用者，我想在搜尋欄中輸入資訊後會有結果資訊

Vue.js學習記錄-12-Vue去哪兒網專案實戰：城市列表頁開發-Header + Vuex實現資料互動

Header：城市資訊選擇標題展示在此元件中，主要做了向Home元件的頁面路由跳轉 <template>：需要注意的是被<router-link>包裹的標籤會使原標籤樣式無效，類似<a>。解決方案上篇文章已經給出：https://blog

Vue.js學習記錄-11-Vue去哪兒網專案實戰：城市列表頁開發-功能點概述 + City

2.城市列表頁開發功能點概述頁面路由跳轉(Home -> City): 點選首頁城市選擇按鈕，即可跳轉至城市列表頁。使用者可以在搜尋欄中可輸入資訊進行城市資訊的檢索，檢索結果以列表形式展現，選定城市後會進行首頁的路由跳轉。

專案練習：百度翻譯小程式

1 # -*- coding:utf-8 -*- 2 # Author:Sure Feng 3 4 import requests 5 import json 6 import sys 7 8 class BaiduFanyi(object): 9 def __init__

android 專案練習：自己的詞典app——生詞本（一）

前言：自學android差不多兩個月了，由於本身對英語不感冒，而且記英語單詞總是很快忘記，因此學習的過程也是蠻累的，好多類和方法都不知道啥意思，還要去查詞典才知道。還是延續我讀書時的記憶方法——每次遇到生詞就寫在筆記本上，下次在遇到就算不記得中文意思，也

Django小型專案練習：模擬商場儲物櫃

學習Django一週時間了，決定寫一個簡單的東西出來，碰巧最近培訓班老師講MySQL，那就寫個儲存相關的吧，於是定計劃，做一個類似商場儲物櫃的小站點。商場超市都會有給顧客放東西的儲物櫃

【JAVAEE學習筆記】hibernate04：查詢種類、HQL、Criteria、查詢優化和練習為客戶列表增加查詢條件

沒有 arrays getpara tex response 寫法 sum exceptio 提高一、查詢種類 1.oid查詢-get 2.對象屬性導航查詢 3.HQL 4.Criteria 5.原生SQL 二、查詢-HQL語法 //學習HQL語法 public

python小練習：給定一個非空且為正整數的列表按重復次數降序排列輸出

class 數字轉換成原來小練習顯示 python index 去重假設有個列表 a=[1,1,1,2,2,4,5,5,5,5] (非空且為正整數) 那麽根據要求最終輸出的形式為 5,1,2,4 (按重復次數降序排列輸出) 代碼實現及解釋： a=[1

Python實踐練習：在 Wiki 標記中添加無序列表

腳本 auth dong com 無序列表 ani board gis run 題目描述項目：在 Wiki 標記中添加無序列表在編輯一篇維基百科的文章時，你可以創建一個無序列表，即讓每個列表項占據一行，並在前面放置一個星號。但是假設你有一個非常大的列表，希望添加前面的星

python列表專案練習

product_list = [ ('Iphone',5800), ('Mac Pro',9800), ('Bike',800), ('Watch',10600), ('Coffee',31), ('Alex Python',120)

C#程式設計基礎-專案1：景點門票收銀系統-練習switch語句、巢狀語句、多重if-else語句的使用

知識點：switch語句、巢狀語句、多重if-else語句。需求說明：景點門票實行淡旺季票價，淡季從1月到6月，普通票價40元，學生票價20元。旺季從7月到12月，普通票價60元，學生票價20元。另外針對不同型別的參觀者，也享受不同的優惠政策。1.2米以下兒童免票，老年人享受5折票價，離休

Matplotlib繪圖專案(四)：2017年內地電影和票房資料情況(條形圖)

需求：繪製2017年內地電影票房前20的電影和票房資料情況條形圖另外，單拎出4部電影，每部電影3天的票房資料, 展示電影本身的票房以及同其他電影的資料對比情況難點：條形圖語法 x軸座標的寬度值如何選取 # 假設你獲取到了20

vue小專案練習——輸入標題並將輸入的標題新增到標題列表

第一次寫部落格，先自我介紹一下吧，我是18屆中國石油大學（華東）電腦科學與技術專業的本科畢業生[有沒有學長或者學姐，吱吱吱]，現從事前端工作。希望通過這個部落格記錄自己的學習之路，加油！今天沒有開發任務，自學了一下vue，做了個小練習。之前只是簡單看了一下vue的模板語法，今天的小例項讓

爬蟲製作2：[轉]python爬蟲例項專案大全

WechatSogou [1]- 微信公眾號爬蟲。基於搜狗微信搜尋的微信公眾號爬蟲介面，可以擴充套件成基於搜狗搜尋的爬蟲，返回結果是列表，每一項均是公眾號具體資訊字典。 DouBanSpider [2]- 豆瓣讀書爬蟲。可以爬下豆瓣讀書標籤下的所有圖書，按評分排名依次儲存，儲存

selenium模組（九）：專案練習

自動登入163郵箱併發送郵件 #注意：網站都策略都是在不斷變化的，精髓在於學習流程。下述程式碼生效與2017-11-7，不能保證永久有效 from selenium import webdriver from selenium.webdriver import ActionChain

4.11 實戰專案3：併發爬蟲

匯入類庫 import ( "fmt" "regexp" "net/http" "io/ioutil" "strings" "sync" "

Java Web學習(8)：階段小專案練習

一輸出圓的資訊專案描述：編寫一個JSP頁面中宣告圓的半徑和計算方法，然後使用表示式，實現輸出圓的半徑，直徑，面積和周長的相關信息。 JSP實現程式碼：

推薦｜23個Python爬蟲開源專案程式碼：爬取微信、淘寶、豆瓣、知乎、微博等

今天為大家整理了23個Python爬蟲專案。整理的原因是，爬蟲入門簡單快速，也非常適合新入門的小夥伴培養信心。所有連結指向GitHub，祝大家玩的愉快 1、WechatSogou [1]– 微信公眾號爬蟲。基於搜狗微信搜尋的微信公眾號爬蟲介面，可以擴充套件成基於搜狗搜尋的爬

專案練習：電影列表爬蟲

相關推薦