豆瓣電影搜尋爬蟲程式，爬蟲小程式，適合初學者

阿新 • • 發佈：2019-02-20

最近在學python，之前用Python寫過簡單的圖片爬取，今天想著用python爬一下豆瓣的電影，就有了下面的程式：

#coding:utf-8
import re
import sys
import urllib
from bs4 import BeautifulSoup
def movieSearch():
<span style="white-space:pre">	</span>douBanSearchurl = "http://movie.douban.com/subject_search?search_text="
<span style="white-space:pre">	</span>data = urllib.urlopen(douBanSearchurl+movieName).read()
<span style="white-space:pre">	</span>r = re.findall(r'<a class="nbg" href=(.*?) onclick',data)
<span style="white-space:pre">	</span>realy_url = re.sub('"','',r[0])
<span style="white-space:pre">	</span>movieData = urllib.urlopen(realy_url).read()
<span style="white-space:pre">	</span>soup = BeautifulSoup(movieData)
<span style="white-space:pre">	</span>movieSummary = soup.find_all("span",{'property':'v:summary'})
<span style="white-space:pre">	</span>#movieSummaryText = re.findall(r'<span property="v:summary" class="">(\W*.*\W*.*?)</span>',movieData)
<span style="white-space:pre">	</span>movie = re.findall(r'name="title" value="(.*?)"',movieData)
<span style="white-space:pre">	</span>people = re.findall(r'name="desc" value="(.*?)"',movieData)
<span style="white-space:pre">	</span>imdb = re.findall(r'</span> <a href="(.*?)" target=',movieData)
<span style="white-space:pre">	</span>Time = re.findall(r'<span property="v:runtime" content="109">(.*?)</span>',movieData)
<span style="white-space:pre">	</span>print u"IMDB電影網連結"
<span style="white-space:pre">	</span>print imdb[0]
<span style="white-space:pre">	</span>print u"豆瓣電影連結"
<span style="white-space:pre">	</span>print  realy_url
<span style="white-space:pre">	</span>print '*'*80
<span style="white-space:pre">	</span>print movie[0].decode('utf-8').encode('gbk')
<span style="white-space:pre">	</span>print people[0].decode('utf-8').encode('gbk')
<span style="white-space:pre">	</span>print u"電影簡介"
<span style="white-space:pre">	</span>print '*'*80
<span style="white-space:pre">	</span>print movieSummary[0].encode('gbk')
if __name__=='__main__':
<span style="white-space:pre">	</span>while(1):
<span style="white-space:pre">		</span>arg = raw_input("請選擇功能:\n1:電影搜尋\n2:退出\n".decode('utf-8').encode('gb2312'))
<span style="white-space:pre">		</span>if arg=='1' :
<span style="white-space:pre">			</span>movieName=raw_input("請輸入電影名:  ".decode('utf-8').encode('gb2312')).strip()
<span style="white-space:pre">			</span>print u"開始搜尋"
<span style="white-space:pre">			</span>movieSearch()
<span style="white-space:pre">		</span>else:
<span style="white-space:pre">			</span>print u"退出程式"
<span style="white-space:pre">			</span>break;<span style="white-space:pre">			</span>

在除錯過程中，遇到了兩個頭疼的問題：

1、beautifulSoup編碼與CMD編碼不匹配，beautifulSoup得到的網頁資訊均為Unicode，但是cmd不支援Unicode只有gbk，中文顯示就成了很大問題了，所以就用了最笨的辦法，通過轉碼來實現，目前還沒找到更好的辦法，如果有請指點下。

2、在寫正則表示式時，不知道<br\>如何匹配，特別是對於網頁文字有換行分段的形式，該如何匹配？

豆瓣電影搜尋爬蟲程式，爬蟲小程式，適合初學者

最近在學python，之前用Python寫過簡單的圖片爬取，今天想著用python爬一下豆瓣的電影，就有了下面的程式： #coding:utf-8 import re import sys import urllib from bs4 import BeautifulSo

案例學python——案例三：豆瓣電影資訊入庫一起學爬蟲——通過爬取豆瓣電影top250學習requests庫的使用

　閒扯皮昨晚給高中的妹妹微信講題，函式題，小姑娘都十二點了還迷迷糊糊。今天凌晨三點多，被連續的警報聲給驚醒了，以為上海拉了防空警報，難不成地震，空襲？難道是樓下那個車主車子被堵了，長按喇叭？開窗看看，好像都不是。好鬼畜的警報聲，家裡也沒裝報警器啊，莫不成家裡煤氣漏了？起床循聲而查，報警

破界！Omi生態omi-mp釋出，用小程式開發生成Web

omi-mp 是什麼 Omi 框架是微信支付線研發部和 AlloyTeam 開源的通用 Web 元件化框架，基於 Web Components，用來開發 PC、手機瀏覽器或者微信、手Q webview 的 Web 頁面。自今年5月開源以來，該專案共獲得 Star 數 5000+，擁有貢獻者29人。經過

小程式跳轉小程式，長按識別小程式碼跳轉小程式解決方案

場景描述：因為小程式跳轉的時候需要公眾號關聯，但是關聯的數量是有限的！因此該文章的處理方案是： a.關聯的小程式，直接可以點選開啟 b.沒有關聯的，那麼可以長按識別小程式碼來進入小程式下面展示效果： 1.點選關聯有appid的時候，直接進入小程式 2.點選沒有appid的

基於java的微信小程式的實現（三）登入，註冊，注小程式端的實現

1.微信小程式專案結構認識 js檔案用來寫相關的邏輯操作，主要是用來操作資料 json檔案用來寫一些相關的配置 wxss相當於css用來寫頁面樣式 wxml相當於html用來寫頁面的元素的 pages資料夾中可以存放多個資料夾，每個資料夾裡面都是一套是js，json

程式設計師的小技能，1行程式碼修改開機密碼、1張圖片讓你電腦宕機

程式設計師很忙，忙著敲程式碼debug，程式設計師有時候也很閒，閒下來的就是就開始自黑，自黑的段子越來越多還被編出了一首詩：“格子襯衫雙肩包、錢多話少死得早，晚睡晚起加班多，沒事就和產品吵”。這屬於藝術，來源於生活，也高於生活，有了誇張的成分。程式設計師作為一個門檻較高的職業，從業人員的

抽屜元件（vue/wx）-基於vue編寫類似elementUi元件，基於小程式語法寫ivew元件

抽屜元件（vue/wx）（vue與微信兩種實現方式）基於vue編寫類似elementUi元件基於小程式語法寫ivew元件基於vue語法寫元件（涉及：父子元件傳值props，子父元件方法傳遞：this.$emit）基於微信語法寫元件（涉及：父

小程式創業：小程式到底有多少個流量入口，真的有40多個嗎?

坐擁微信強大流量和10億月活使用者數的小程式，自上線以來，流量入口便不斷開放。據不完全統計，小程式目前已擁有40多個流量入口。作為小程式使用者人群中一員，你知道微信小程式都有哪些入口嗎? 今天我們就來盤點一下小程式到底有多少個入口，真的有40多個流量入口嗎?

【微信小程式控制硬體②】開始微信小程式之旅，匯入小程式Mqtt客戶端原始碼，實現簡單的驗證和通訊於伺服器！（附帶原始碼）

本博文由熱愛分享熱愛技術的半顆心臟原創，非官方人員、非組織名義編寫，博文如有不對或侵犯您的權益，請及時留言，第一時間糾正！一、前言；繼續我們的小程式控制智慧硬體（包括esp8266）學

【小程式社群】小程式社群提供微信小程式和支付寶小程式相關的資訊、開發教程、開發指南、小程式DEMO等資源。小程式開發社群是國內微信小程式和支付寶小程式開發的領先社群，這裡有最新的功能、最全的DEMO、最多的教程和最

小程式社群小程式社群提供微信小程式和支付寶小程式相關的資訊、開發教程、開發指南、小程式DEMO等資源。小程式開發社群是國內微信小程式和支付寶小程式開發的領先社群，這裡有最新的功能、最全的DEMO、最多的教程和最...

“小程式 · 雲開發”重磅上線，讓小程式開發更高效！

近日，“小程式 · 雲開發”解決方案正式上線，該方案可以為小程式開發者提供完整的雲端支援。通過簡

uni-app 1.4 釋出，一套程式碼，發行小程式（微信/支付寶/百度）、H5、App多個平臺

在2019新年到來之際，uni-app 1.4版本正式釋出，新增支援百度、支付寶小程式，開放外掛市場，同時注入更多優秀特性，為開發者送上了一份新年大禮！支援更多小程式平臺 uni-app 1.4 版本新增支援百度、支付寶小程式，從此一次開發，可釋出小程式（微信/支付寶/百度）、H5、App（iOS/An

[發福利]APPx雙11上線大放價，定製小程式只需一元

雙11來了，許多商家、企業都想在這個購物狂歡節中分一杯羹，因此，自然少不了在品牌宣傳、展示，活動營銷、運營上猛下功夫。而宣傳渠道上，不外乎PC官網、手機網站、微信公眾號、微官網、H5……這些平臺，然而，這麼多的平臺=大量的建站費、維護費、人工費……！有沒有更

程式設計師英語小白，如何拿到外企offer？

什麼方法使0基礎學生3個月就能說一口流利英語？一天晚上，他接到學生髮來的簡訊：“老師，這三個月來

【視訊】詳解小程式wx.requestpayment用法，實現小程式線上支付功能

開發小程式商城，外賣小程式，銷售型小程式等，具有線上支付功能的，都會使用wx.requestpayment()這個介面。好多學員反饋說這個介面很難，今天子恆老師跟你分享一下，怎麼使用wx.requestpayment實現微信支付。一、使用wx.requestpayment實

“附近的餐廳”內測，餐飲小程式將引領2019年第一波創業熱潮

最近，月活使用者破10億的APP微信，在廣州內測了一個新的功能，附近的餐廳。 “附近的餐廳”分為美食圈、找餐廳、我3個欄目，裡面幾乎是大眾點評在餐飲領域所做的全部內，怕是又要搶大眾點評的生意了。微信附近的餐廳在哪裡我們開啟手機上的微信，進入微信首頁，點選【發現】這時，我們可以看到【附近的餐廳】，

微信小程式框架製作-第02課-開發準備：賬號申請，準備小程式的APPID

官方申請地址：https://mp.weixin.qq.com/ 申請微信小程式賬號準備好自己的APPID(微信小程式，非公眾號) 開發欄目中檢視申請賬號-教程-參考網址： https://developers.weixin.qq.com/miniprogra

中國象棋人機對弈搜尋演算法學習-極大極小值，負極大值，alpha-beta演算法

極大極小值法深度搜索（dfs）虛擬碼 /** 1。 p 為棋盤 2。 d 為規定的搜素最大深度，比如d層紅方，d-1層為黑方，d-2層為紅方...依此類推，可採用mod2來判斷當前是哪一方 4。評估棋盤的函式evaluation,當然需要看

小程式思維導圖，讓小程式不再難懂（一）

寫在前面首先，很感謝大家喜歡我的思維導圖。有網友評論說：思維導圖實際就是一種比純文字更貼近人理解的模型——知識關係。的確，思維導圖又稱為腦圖，是一種適合頭腦風暴模式，同時又適合梳理點與點之間的一種表現形式。當然，java作為一門語言，設及的的技術很多，知識面也是很廣

【JavaEE學習筆記】Spring_01_工廠模式，Spring小程式，IoC控制反轉

Spring_01 A.工廠模式 1.概述是由專家總結出來的，在某種情況下解決某類問題的最佳解決方案設計模式六大原則單一職責原則里氏替換原則依賴倒置原則介面隔離原則迪米特法則開

豆瓣電影搜尋爬蟲程式，爬蟲小程式，適合初學者

相關推薦