爬圖交互界面及翻頁初嘗式

阿新 • • 發佈：2017-09-14

語法 aso raw star write conn aid zip pen

# -*- coding:utf-8 -*-


import requests, re, os,urllib2
class TP:
    def __init__(self,baseUrl): #baseUrl是基本地址
    #url = ‘http://tieba.baidu.com/p/5307547413‘ 
        self.baseURL=baseUrl
        #傳入頁碼，獲取該頁帖子的代碼
    def getPage(self,pageNum):
        try:
            url=self.baseURL+‘?pn=‘+str(pageNum)
        res 
=urllib2.Request(url)
        html=urllib2.urlopen(res).read().decode(‘UTF-8‘)
        return html
    
    except urllib2.UrlError,e:#為什麽這麽寫
        if hasattr(e,"reason"):#hasattr是什麽意思
        print u‘錯誤‘,e.reason
        return None    
    def getPageNum(self,page):  #獲取頁碼
        page=self.getPage(1)# 
這個是第一頁的網址信息
        pattern=re.compile(‘<li class="l_reply_num" .*?</span>.*?<span.*?>(.*?)</span>‘,re.S)
        result=re.search(pattern,page)
        if result:
            return result.group(1).strip()
        else:
            return None
    #提取圖片
    def getContent(self,html):
            header  
= {
                   ‘Accept‘: ‘*/*‘,
                    ‘Accept-Encoding‘:‘gzip,deflate,sdch‘,
                    ‘Accept-Language‘:‘zh-CN,zh;q=0.8‘,
                    ‘Connection‘:‘keep-alive‘
                    }
            html = requests.get(url,headers = header)
            
            data = html.content.decode(‘utf-8‘)
            find = re.compile(r‘<img class="BDE_Image" src="(.*?).jpg"‘)
            result = find.findall(data)     
            for img_url in result:
                name = img_url.split(‘/‘)[-1]
                img_url = img_url+‘.jpg‘
                html = requests.get(img_url,headers = header)
                im = html.content
                with open(name+‘.jpg‘,‘wb‘)as f:
                    f.write(im)
      
 
    def start(self):
        indexPage=self.getPage(1)
        pageN=self.getPageNum(indexPage)
     
        if pageN==None:
            print "URL error"
            return
        try:
            print u‘該帖子有‘+str(pageN)+‘頁！‘#
            for i in range(1,int(pageN)+1):
                print u‘正在讀入第‘+str(i)+‘頁數據‘
                page=self.getPage(i)
                contents=self.getContent(page)
        except IOError,e:
            print u‘正在寫入第‘+str(i)+‘頁數據‘
        finally:
            print u‘爬取任務完成^_^‘
print u‘請寫入帖子號碼‘
baseUrl=‘http://tieba.baidu.com/p/‘+str(raw_input(u‘http://tieba.baidu.com/p/‘))
pt=TP(baseUrl)
pt.start()

問題尚未完成，無法翻頁且圖片出不來，明天瞅瞅語法仔細盤盤邏輯

爬圖交互界面及翻頁初嘗式

語法 aso raw star write conn aid zip pen # -*- coding:utf-8 -*- import requests, re, os,urllib2 class TP: def __init__(self,baseUrl)

在Python3解釋器的交互界面下使用方向鍵產生亂碼的解決辦法

python readline python3 方向鍵現象: 在python3的解釋器交互界面使用方向鍵會產生類似: [d^[C之類的亂碼.原因: 未使能readline功能解決辦法:yum install -y readline-devel //安裝C的readline相關文件make

E-PUCK機器人-PC人機交互界面

www. 缺少人機交互 5.0 協議 qmake 交互界面應該 creator 　　為了使用方便，E-PUCK團隊開發了一個在計算機上運行並通過藍牙連接到e-puck的接口，該接口基於先進的sercom協議（選擇器3）; 通過該界面，可以獲得有關所有傳感器的信息，接收攝

【PS基礎第一篇】PS認識工作界面及調圖

工作技術命令暫時 text 對比 images https term PS認識工作界面工作界面組成（1）標題欄（2）菜單欄（3）屬性欄（4）工具箱（5）工作區（畫布）（6）浮動面板簡化工作界面（1）菜單欄：（先認識文件、編輯、圖像3個菜單）（2）工具

計算器界面及關閉窗口

ext awt extends apt tla event border etl you import java.awt.*;import java.awt.BorderLayout;import java.awt.Button;import java.awt.Frame;

ORACLE安裝報錯無法打開圖像化界面

grid報錯信息：[grid@rhel65 grid]$ ./runInstaller Starting Oracle Universal Installer...Checking Temp space: must be greater than 120 MB. Actual 34027 MB Pa

02_Linux圖形界面及文件系統結構介紹

介紹文檔 bin 所在 edi 圖形引導文件系統不同一、根目錄 / ：它跟Windows的C、D、E、F不同，在Linux中，所有的文件系統（光驅、U盤、硬盤）都掛載到根目錄的某一個文件夾下 bin : 存放二進制可執行文件 sbin　　：存放二

CentOS 7 mini安裝後安裝圖形界面及遠程設置

stop 遠程桌面遠程桌面連接 centos 7 systemctl fire blog entos server 安裝圖形界面 yum group install "GNOME Desktop" "Graphical Administration Tools"

RedHat安裝圖形化界面及使用Yum提示需要註冊問題處理

單用戶模式 seve IV parser gre 同事備份意義單個問題描述：-Redhat 6.6Mini無法用自帶yum倉庫安裝圖形化界面；-執行Yum操作均提示This system is not registered to Red Hat Subscripti

Axure軟件界面及元件

優化原型選擇進行右上角基本操作交互註意 spa Axure 軟件的需求史　　功能：用來制作快速原型的軟件。也可以繪制中保真原型草圖。（適用人群：產品經理，交互設計師，UI設計師，網頁設計師，想要自己提升的人【重】）　　原型分類：　　低保真原型（草圖

Blender界面及模式統計

info 統計 img blender bubuko mage png 窗口 .com Blender2.79b安裝後默認界面分布: 所有窗口: 窗口: 3D View的9種模式: Blender界面及模式統計

【比賽打分展示雙屏管理系統-專業版】排行榜界面及專家評語提交展示等具體配置

專家 alt 比賽 bubuko 排行專業 http 配置雙屏【比賽打分展示雙屏管理系統-專業版】排行榜界面及專家評語提交展示等具體配置

爬取拉勾網資訊，翻頁爬取

import requests #這個庫等價於 urllib 和urllib2 import bs4 #作用是用來解析網頁的 import json#主要是一種資料交換格式 import time de

iOS與H5界面JSBridge交互Demo

view http tails user div ffi bsp end epic iOS與H5界面JSBridge交互Demo 最近公司需要加活動和新聞模塊, boss看同樣的設計稿, 我們iOS做一遍, 安卓做一遍, 小程序又做一遍; 所以決定用H5頁面. 但我們Nat

記錄一下本應用《任您記）APP項目中點擊底部導航欄四個按鈕，則界面顏色跟著變化及圖標字放大效果

process 分享圖片 ima char ive see ext back otto 底部導航欄四個按鈕代表四個顏色，點其中其中一個按鈕，則換一種顏色，顏色代碼和圖標都保存在相應的數組裏，具體如下：使用的開源庫是：LuseenBottomNavigation本應用《任您

GUI 即人機交互圖形化用戶界面設計

交互綜合素質水平產業市場研究界面設計圖形化國際 GUI 即人機交互圖形化用戶界面設計。縱觀國際相關產業在圖形化用戶界面設計方面的發展現狀，許多國際知名公司早已意識到 GUI 在產品方面產生的強大增值功能，以及帶動的巨大市場價值，因此在公司內部設立了相關部門專

使用jupyter搭建golang的交互式界面：類似於ipython

data 效果 oca books jupyter -s pre posit number Jupyter Notebook The Jupyter notebook is a web-based notebook environment for interactive c

Java Swing界面編程(25)---事件處理：鼠標事件及監聽處理

鼠標右鍵 util else if this setbounds user swing 事件處理 dem 假設想對一個鼠標的操作進行監聽，假設鼠標按下、松開等。則能夠使用MouseListener接口。 package com.beyole.util; import

運用GRASP原則來做uml交互類圖-------pos機實例

enter 創建者模式事件高內聚 uml 創建我們 gis nts 重要的幾個GRASP原則：1.控制器模式 2.創建者模式（原則）3。信息專家模式（原則） 4. 高內聚低耦合這裏所說的模式並不是java中針對具體的事件的設計模式主成功場景的幾個操作：

MFC打開子界面，隱藏主界面後，程序圖標在任務欄消失問題

窗口父窗口 () spa 主界面問題 font bsp top 在子窗口的構造函數中，父窗口改為通過GetDesktopWindow獲取。 CDIALOG::CDIALOG(CWnd* pParent /*=NULL*/): CDialogEx(CDIALOG::I

爬圖交互界面及翻頁初嘗式

相關推薦