1. 程式人生 > >一個Python 爬蟲程式

一個Python 爬蟲程式

一個簡單的實現煎蛋網妹子圖片爬取的Python指令碼

# -*- coding:utf-8 -*-
'''
version:Python 2.6
standard libs: urllib
author:Dead_morning
system: cetos 6.5
'''
import re
import urllib

def get_content(html_page):
'''html downladd'''
    html = urllib.urlopen(html_page)
    content = html.read()
    html.close()
    return content

def get_images(info):
'''html parser'''
    regex = r'href="//wx(.+?\.(?:gif|jpg|jpeg|png))" ' # download original picture
    #使用正則表示式為了下載原圖,這裡可使用 soupbeautiful 模組替代正則表示式
    pat = re.compile(regex)
    image_code = map(lambda x: 'http://wx'+ x , re.findall(pat,info))
    return image_code

def Download_image():
''' image download'''
    for image_url in get_images(info):
        print image_url
        image_name = image_url.split('/')[-1]
        # 給檔案命名 
        urllib.urlretrieve(image_url,image_name)

def html_pages():
''' URl list'''
#因為煎蛋網的網址比較有規律,所以就用了一個簡單的List替代了從網頁裡解析
    b = []
    for a in range (1 ,95):
        url= 'http://jandan.net/ooxx/page-%s#comments' %a
        b.append(url)
    return b

if __name__ == '__main__':   
    for html_page in html_pages():
        info = get_content(html_page)
        print Download_image()

相關推薦

一個Python 爬蟲程式

一個簡單的實現煎蛋網妹子圖片爬取的Python指令碼 # -*- coding:utf-8 -*- ''' version:Python 2.6 standard libs: urllib autho

Java程式設計師的第一個Python程式:京東暢銷書榜爬蟲

畢業後的5年多時間裡一直在Java的生態體系裡遊走,很少觸碰其他非Java技術棧。職業安全感隱隱的警告我不能一直逗留在自己的舒適區裡,不能被大時代拋棄。時下最火的莫過於AI, 而AI時代則帶火了AI第一語言Python,那就學學Python。學習一門新技術的最佳

一個python爬蟲——保存淘寶mm圖片

gen with open 代號 [] 文件夾 暫時 觀察 python基礎 意義 第一次算是成功的爬蟲小代碼,花了挺長時間的。目的:  獲取淘寶mm圖片現存問題:  無法獲取動態加載的圖片,只能得到打開網頁後存在的圖片  雖然更換代理仍禁止訪問收獲:    對爬蟲的思路

我的第一個python爬蟲:爬取豆瓣top250前100部電影

爬取豆瓣top250前100部電影   1 # -*-coding=UTF-8 -*- 2 3 import requests 4 from bs4 import BeautifulSoup 5 6 headers = {'User-Agent':'Moz

一個python程式——即時動態時鐘(程式碼解讀)

程式碼資源來自: http://n.miaopai.com/media/K9Qlou7rdPc5TxpPaL1VDvwfv5hP~lHK   (執行有錯誤,缺少date,week和結尾部分) https://blog.csdn.net/yangxing2/article/details

Python入門》第一個Python Web程式——簡單的Web伺服器

分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!        

Pycharm+Django搭建第一個Python Web程式

1.安裝django 無論是Python2.x還是Python3.x版本,都可以使用pip來安裝Django。在控制檯使用如下命令:pip install django 如: 2.檢查dgango是否安裝成功 安裝成功後,在ipython裡面或者Pycharm的Python console控制檯匯入d

定期執行 Python 爬蟲程式並儲存至資料庫

例行性工作排程Linux 提供使用者執行例行性工作排程的指令是 crontab,加入工作排程之前首先我們用指令 crontab -l 看目前的 AWS Lightsail 使用者(ubuntu)有無工作排程。crontab -l## no crontab for ubuntu系統告訴我們目前這個伺服器上沒有工

一個Python爬蟲-抓取煎蛋網上圖片

背景 作為一個計算機基礎薄弱的電氣工程師,廖大的教程看到常用的內建模組時,看的頭大,特別是看到HTMLParser時,已宛如天書了。這時作為一個初學者的劣勢就暴露出來了,我不知道哪部分知識是理解這些模組的前置條件,即使知道是哪部分知識,但不知道該理解到什麼程度才能解決當前的問題。個人建議

Python入門 第一個Python Web程式——簡單的Web伺服器

  上一篇講了《Python入門》Windows 7下Python Web開發環境搭建筆記,接下來講一下Python語言Web服務的具體實現:第一個Python Web程式——簡單的Web伺服器。 與其它Web後端語言不同,Python語言需要自己編寫Web伺服器。 如果你使用一

[CentOS Python系列] 一.阿里雲伺服器安裝部署及第一個Python爬蟲程式碼實現

從2014年開始,作者主要寫了三個Python系列文章,分別是基礎知識、網路爬蟲和資料分析。它們都是基於Windows系統下的Python程式設計,每個系列都從安裝過程、基礎知識到實際應用三個方面進行講

抄來的一個Python爬蟲demo,備忘

從知乎上抄過來的demo,作者是在ios下開發的,直接拿到windows平臺上執行有報錯。所以做了修改,下面是修改後的原始碼:# -*- coding: utf-8 -*- """ Created on Wed Apr 11 14:57:23 2018 @author: s

我的第一個Python爬蟲——談心得

2018年3月27日,繼開學以來,開了軟體工程和資訊系統設計,想來想去也沒什麼好的題目,乾脆就想弄一個實用點的,於是產生了做“學生服務系統”想法。相信各大高校應該都有本校APP或超級課程表之類的軟體,在資訊化的時代能快速收集/查詢自己想要的諮詢也是種很重要的能力

使用PyQt來編寫第一個Python GUI程式

這段程式碼有什麼用?還記得我們把按鈕命名為了calc_tax_button 嗎?(這是這個按鈕物件的名字,不是按鈕上顯示的提示字串。)clicked 是一個內建的函式,當有按鈕被點選的時候它會被自動呼叫(很神奇吧)。所有的 QT 元件都有特定的函式,你可以通過 Google 來檢視詳細。這段程式碼的最後部

我的第一個Python程式

大家好,我一個月前剛開始學Python,前幾天剛完成一個小遊戲,這遊戲使用了4個模組。 1- PyQt5 (需要下載) 2- random (Python自帶) 3- sys (Python 自帶) 4- texttable (需要下載) 首先,玩家一開始時會有10積分,

一個Python程式(Hello World!)

當安裝好python時,可以在命令提示符中直接輸入 python 就可以進入python自帶的編輯器(最好不要使用root使用者,因為當你不小心把資料給刪了,那可不是一般罪過啊!),如圖: 此

一個python程式

第一個python程式,hello world 使用sublime 文字編輯器,首先需要下載python 推薦幾個sublime 的外掛 SublimeREPL、Anaconda print('hello world')

用Eclipse和wxpython搭建一個Python Gui程式開發環境

從今天凌晨2點到現在。花了幾乎20個小時的時間去研究py Gui程式的基本規則,然後為了用py2exe給程式打包,差點沒瘋掉。在此總結一下經驗。 1.py2exe的版本一定要和python的版本完全匹配,才能保證打包的順利進行。 2.用eclipse和wxpython搭建整合環境時應注意Path環境

day04 第一個python程式

使用Pycharm編寫第一個python程式1. 開啟 Pycharm,選擇  Create New Project  ,建立一個新專案2. 選擇 Pure Python  表示建立一個純Python程式專案,  Location  表示該專案儲存的路徑, Interpret