Python爬取大樂透

阿新 • • 發佈：2018-12-05

因為筆者經常投彩票，於是做了一個玩，初版本只是爬取，效果如下：
在這裡插入圖片描述
程式碼如下：

import requests
from requests.exceptions import RequestException
from lxml import etree
count = 0
def get_page(url):
    try:
        headers = {
            'user-agent': 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Mobile Safari/537.36',
            'accept-language': 'zh-CN,zh;q=0.9',
            'cache-control': 'max-age=0',
            'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8'
        }
        response = requests.get(url=url,headers=headers)
        # 更改編碼方式，否則會出現亂碼的情況
        response.encoding = "utf-8"
        if response.status_code == 200:
            return response.text
        return None
    except RequestException:
        return None
def parse_page(html):
    try:
        global count
        count+=1
        res = etree.HTML(html)
        red = res.xpath('//*[@class="smallRedball"]//text()')
        blue = res.xpath('//*[@class="smallBlueball"]//text()')
        print(red+blue)
    except Exception as e:
        pass
def main(num):
    url = 'http://caipiao.163.com/t/award/dlt/{}.html'.format(str(num))
    html = get_page(url)
    parse_page(html)
if __name__ == '__main__':
    for num in range(17001,17154):
        main(num)
    for num in range(18001, 18140):
        main(num)
    print("大樂透爬取結束...")
    print("爬取的數目為："+str(count))

Python爬取大樂透

因為筆者經常投彩票，於是做了一個玩，初版本只是爬取，效果如下：程式碼如下： import requests from requests.exceptions import RequestException from lxml import etree count = 0 def

我用 Python 爬取微信好友，最後發現一個大秘密

代碼我們同學 strong 分享簽名 ast ron tps 前言你身處的環境是什麽樣，你就會成為什麽樣的人。現在人們日常生活基本上離不開微信，但微信不單單是一個即時通訊軟件，微信更像是虛擬的現實世界。你所處的朋友圈是怎麽樣，慢慢你的思想也會變的怎麽樣。最近在學習

python爬取拉勾網網際網路大資料職業情況

爬取拉勾網資訊資料處理製圖所需知識只有一點點（畢竟是個小白）： requests基礎部分 json pyecharts wordcloud 接下來開始敲程式碼了，程式碼分成了3個部分：爬取、製圖、生成詞雲爬取部分：首先要說明的是，拉勾網有反爬

Python爬取鬥圖表情，讓你成為鬥圖大佬

話不多說，上結果（只爬了10頁內容）上程式碼：（可直接執行）用到Xpath #encoding:utf-8 # __author__ = 'donghao' # __time__ = 2018/12/24 15:20 import requests imp

學以致用:Python爬取廖大Python教程製作pdf

當我學了廖大的Python教程後，感覺總得做點什麼，正好自己想隨時查閱，於是就開始有了製作PDF這個想法。想要把教程變成PDF有三步：先生成空html，爬取每一篇教程放進一個新生成的div，這樣就生成了包含所有教程的html檔案(BeautifulSoup) 將html轉換成p

   學以致用:Python爬取廖大Python教程製作pdf

python-tutorial-pdf 當我學了廖大的Python教程後，感覺總得做點什麼，正好自己想隨時查閱，於是就開始有了製作PDF這個想法。想要把教程變成PDF有三步：先生成空html，爬取每一篇教程放進一個新生成的div，這樣就生成了包含所有教程的ht

學以致用:Python爬取廖大Python教程製作pdf！

python-tutorial-pdf 當我學了廖大的Python教程後，感覺總得做點什麼，正好自己想隨時查閱，於是就開始有了製作PDF這個想法。想要把教程變成PDF有三步：先生成空html，爬取每一篇教程放進一個新生成的div，這樣就生成了包含所有

我用 Python 爬取微信好友，最後發現一個大祕密

前言你身處的環境是什麼樣，你就會成為什麼樣的人。現在人們日常生活基本上離不開微信，但微信不單單是一個即時通訊軟體，微信更像是虛擬的現實世界。你所處的朋友圈是怎麼樣，慢慢你的思想也會變的怎麼樣。最近在學習 itchat,然後就寫了一個爬蟲，爬取了我所有的微信好友的資料。並對其中的一些資料進行分析，發現了一些很有

用Java抓取10年大樂透中獎資料

最近突發奇想，想用java拉去最近十年的大樂透中獎資料，然後使用機器學習預測下一期的開獎結果，看看能不能瞬間財務自由，第一步：拉取最近十年的大樂透中獎資料。首先找個能查詢大樂透開獎資料的網站： https://www.cjcp.com.cn 找到大樂

python爬取網易雲音樂歌單音樂

string attrs default textarea bsp color read contents dom 在網易雲音樂中第一頁歌單的url：http://music.163.com/#/discover/playlist/ 依次第二頁：http://music.1

python 爬取qidian某一頁全部小說

decode return data- dib read etc break beautiful range 1 import re 2 import urllib.request 3 from bs4 import BeautifulSou

Python爬取今日頭條段子

找到 eat 修改是什麽一次時間地址 style 用戶名剛入門Python爬蟲，試了下爬取今日頭條官網中的段子，網址為https://www.toutiao.com/ch/essay_joke/源碼比較簡陋，如下： 1 import requests 2 i

利用python爬取龍虎榜數據及後續分析

登錄 one 可能股市 .com 爬蟲但我由於相關 ##之前已經有很多人寫過相關內容，但我之前並未閱讀過，這個爬蟲也是按照自己的思路寫的，可能比較醜陋，請見諒！本人作為Python爬蟲新手和股市韭菜，由於時間原因每晚沒辦法一個個翻龍虎榜數據，所以希望借助爬蟲篩選出

python爬取豆瓣小組700+話題加回復啦啦啦python open file with a variable name

技術分享 ash 寫入 blog ima ron tar 回復 -128 需求：爬取豆瓣小組所有話題（話題title，內容，作者，發布時間），及回復（最佳回復，普通回復，回復_回復，翻頁回復，0回復）解決：1. 先爬取小組下，所有的主題鏈接，通過定位nextp

Node.js/Python爬取網上漫畫

版本中間 kit ont mic 這一圖片加載同步改變　　某個周日晚上偶然發現了《火星異種》這部漫畫，便在網上在線看了起來。在看的過程中圖片加載很慢，而且有時候還不小心點到廣告，大大延緩了我看的進度。後來想到能不能把先把漫畫全部抓取到本地再去看。　　經過一段時間

python爬取百度搜索圖片

知乎需要 with 異常 mage 不足 request height adr 在之前通過爬取貼吧圖片有了一點經驗，先根據之前經驗再次爬取百度搜索界面圖片廢話不說，先上代碼 #!/usr/bin/env python # -*- coding: utf-8 -*- #

Python爬取百度貼吧數據

utf-8 支持我 family encode code word keyword 上一條時間　　本渣除了工作外，在生活上還是有些愛好，有些東西，一旦染上，就無法自拔，無法上岸，從此走上一條不歸路。花鳥魚蟲便是我堅持了數十年的愛好。　　本渣還是需要上班，才能支持我的

python爬取七星彩的開獎歷史記錄

clas 程序代碼 aip dal zip file utf mage decode 1.因為人不可能一直無休止的學習，偶爾也想做點兒別的，昨天無聊就想寫寫Python，當然我承認我上班後基本都是在學工作方面的事情，在這個崗位我也呆了三年多了，還是那句話問我什麽會不會我會給

python爬取網頁圖片

ima com col list https pytho 表達式 images 5% 在Python中使用正則表達式，一個小小的爬蟲，抓取百科詞條網頁的jpg圖片。下面就是我的代碼，作為參考： #coding=utf-8 # __author__ = ‘Hinfa‘ im

python爬取百度搜索結果ur匯總

百度搜索 sta attr amp end rom range 百度篩選寫了兩篇之後，我覺得關於爬蟲，重點還是分析過程分析些什麽呢： 1）首先明確自己要爬取的目標　　比如這次我們需要爬取的是使用百度搜索之後所有出來的url結果 2）分析手動進行的獲取目標的過程，以便

Python爬取大樂透

相關推薦