[用科學的方法做不科學的事情繫列]---分析五百萬大獎-雙色球之花落誰家?(1)

阿新 • • 發佈：2018-11-11

目的:
瞧瞧雙色球裡的各種資料.
用阿里雲的pai來分析分析雙色球相關的東西.

獲取資料

環境搭建

安裝 python3
安裝 pip
安裝第三方模組

pip install BeautifulSoup
pip install requests

算了,不廢話,直接上程式碼吧.

import requests
from bs4 import BeautifulSoup
import json
import time
def url_find(url):
    r = requests.get(url)
    r.encoding='utf-8'
    soup = BeautifulSoup(r.text, 'html.parser')
    x = soup.find_all('a')
    xx = []
    for i in x:
        #print(i)
        if str(i).find("期開獎公告")>0:
            m = "http://www.cwl.gov.cn"+i.get('href')
            #print(m)
            xx.append(m)
    return xx
def cat_text(url):
    m={}
    r = requests.get(url)
    r.encoding='utf-8'
    soup = BeautifulSoup(r.text, 'html.parser')
    y=[]
    for x in soup.find_all('td'):
        y.append(x.get_text())
    x_id=str(soup.h2.get_text())[10:17]
    for i in soup.find_all("script"):
        if str(i).find("var khHq") > 0:
            qiu_h=json.loads(str(i)[24:55])
    for i in soup.find_all("span"):
        
        if i.get("class") == ["qiuL"]:
            qiu_l=i.get_text()
    for i in soup.find_all("div"):
        if i.get("class") == ["zjqkzy"]:
            address=i.find("dd").get_text()
    if y[3]=='- 元':
        mm = x_id + "," + y[0] + "," + y[1].rstrip(" 元").replace(",","") + ","+ y[2].rstrip(" 元").replace(",","") + ","+ y[9] +","+  y[10].split("（")[0] + ","+ y[12] +",TEst"+  y[13].split("(含")[0]+ ","+ y[15].split("（")[0] +","+  y[16] + ","+ y[18] +","+  y[19] + ","+ y[21] +","+  y[22] + ","+ y[24] +","+  y[25] +","+str(qiu_h).replace("[","").replace("]","").replace(" ","").replace("'","")+","+qiu_l+","+address.replace(",","--").replace("。","").replace("共","").replace("注","")
    elif y[11]=='其中:一等獎複式投注':
        mm = x_id + "," + y[0] + "," + y[1].rstrip(" 元").replace(",","") + ","+ y[2].rstrip(" 元").replace(",","") + ","+ y[9] +","+  y[10].split("（")[0] + ","+ y[12] +","+  y[13].split("(含")[0]+ ","+ y[15].split("（")[0] +","+  y[16] + ","+ y[18] +","+  y[19] + ","+ y[21] +","+  y[22] + ","+ y[24] +","+  y[25] +","+str(qiu_h).replace("[","").replace("]","").replace(" ","").replace("'","")+","+qiu_l+","+address.replace(",","--").replace("。","").replace("共","").replace("注","")
    else:
        mm = x_id + "," + y[0] + "," + y[1].rstrip(" 元").replace(",","") + ","+ y[2].rstrip(" 元").replace(",","") + ","+ y[7] +","+  y[8].split("（")[0] + ",,,"+ y[10] +","+  y[11].split("(含")[0]+ ","+ y[13].split("（")[0] +","+  y[14] + ","+ y[16] +","+  y[17] + ","+ y[19] +","+  y[20] + ","+ y[22] +","+  y[23] +","+str(qiu_h).replace("[","").replace("]","").replace(" ","").replace("'","")+","+qiu_l+","+address.replace(",","--").replace("。","").replace("共","").replace("注","")
    return mm
url = 'http://www.cwl.gov.cn/kjxx/ssq/kjgg/list.shtml'

url_list = []
url_list = url_list + url_find(url)
for i in range(29):
    url = 'http://www.cwl.gov.cn/kjxx/ssq/kjgg/list_' + str(i+2) + '.shtml'
    url_list = url_list+url_find(url)
#print(url_list)
def save_file(somea):
    with open('./data', 'a') as f:
        f.write(somea )
for i in url_list:
    data=str(cat_text(i))+"\n" 
    save_file(data)

[用科學的方法做不科學的事情繫列]---分析五百萬大獎-雙色球之花落誰家?(1)

目的:瞧瞧雙色球裡的各種資料.用阿里雲的pai來分析分析雙色球相關的東西. 獲取資料中獎公告:http://www.cwl.gov.cn/kjxx/ssq/ 環境搭建安裝 python3 安裝 pip安裝第三方模組 pip install BeautifulSoup pip install

jmeter 一些測試用的方法【不定時補充】

目錄 1、獲取當前執行緒的名稱 ctx.getThread().getThreadName() 2、儲存變數到檔案中 3、儲存變數到全域性屬性/變數中 4、在beanshell中通過CookieManager新增cookie資訊 1、獲取當前執行緒的名稱 ctx.getThr

學會用出世智慧做入世的事情

在接受了某公司的電話面試後，自我感覺不錯，但後來得到了一個和自己感覺反差很大的結果，對照著電面結果，自己也做了深刻的反思，雖然自己做Java開發工作已經近三年，但感覺給我的評價很客觀，是入木三分，正所謂信言不美，美言不信。評價結論是：[list][*]1.Java基

sqlplus無法登陸用系統方法做dump

>... Reading symbols from /u01/app/oracle/product/11.2.0.3/db_1/bin/oracle...(no debugging symbols found)...done. Attaching to program: /u01/app/oracle/

【HTML】用ajax方法獲取不到return返回值

兩個錯誤寫法會導致這種情況：A、ajax未用同步；B、在ajax方法中直接return返回值。下面列舉了三種寫法，如果想成功獲取到返回值，參考第三種寫法：方法一：未獲得返回值/** * 方式：（1）同步呼叫（2）在ajax函式中return值 * 結果：返回 1----

C++用回溯方法做全排列的代碼

sin als eof set return using ems result fin 學習閑暇時間，將內容過程經常用的一些內容記錄起來，下邊內容是關於C++用回溯方法做全排列的內容，應該能對各位有一些好處。 #include<cstring> #include

用matlab預測雙色球的方法

下面是原始碼(fc.m)： function y=fc(isPloy,factorial);%function y=fc(isPloy,factorial);%factorial表示預測函式的階乘個數,預設是5%isPloy判斷引數的個數，來決定是否，每個階都進行畫圖,預設

Java 用兩個一維數組實現雙色球彩票

flag true 模擬用兩個 div for arr 全部 lean 設計一個程序，模擬雙色球的選號過程（6個藍球+1個紅球），要求：生成的6個紅球號碼不重復數字大小在（1-33）之間，藍球大小（1-16）之間。思路： 1、創建一個int類型的一維數組balls

我用Python把雙色球的網站“黑”了！下個1.5億大獎會是我嗎？

本篇主要介紹爬取500彩票網，獲取所有雙色球的開獎結果，寫入到csv檔案。 (1) 分析標題通過分析，發現標題資訊在如下地方顯示：進群：548377875 即可獲取

用python程式設計雙色球彩票系統（改良）

# author : momo ''' 開始遊戲之後，請使用者輸入投入的金額，使用者可以選擇購買彩票的張數，一張彩票是兩塊錢，當金額不足時，可以提示使用者繼續投入金額，若使用者拒絕投入，則退出遊戲。此時系統可以隨機產生一組資料，一組彩票資料有六位數，這六位數的的取值範圍是0和1。若金額充足，

用python程式設計雙色球系統

# author : momo ''' 寫一個雙色球彩票系統，系統可以隨機產生一組資料，一組彩票資料有六位數，這六位數的的取值範圍是0和1。一張彩票是兩塊錢，可以設定使用者的金額，使用者可以選擇繼續買票或者是退出。買票和退出的時候要求列印剩餘金額。使用者輸入猜測的資料，若是猜對，則列印”恭喜你中

剛學Collection，重新修改下以前做的雙色球程式

以前用陣列做的，優點相對Collection某些實現類要麻煩的多，尤其在判斷重複的雙色球上，下面是程式碼： package src; public class ShuangSeQiu { /*

Java中數值較大的double型別轉換為字串時會用科學計數法不使用千分位顯示的解決辦法

java.text.NumberFormat nf = java.text.NumberFormat.getInstance(); // 不使用千分位，即展示為11672283.234，而不是11,672,283.234 nf.setGroupingUsed(false); // 設

電腦科學採用訓練資料集，驗證資料集，測試資料集的方法為什麼不採用統計學中常用的假設檢驗呢？（引數檢驗和非引數檢驗）

如題所說，這個問題作為一個本科讀管理，碩士讀計算機卻旁修經濟學，博士在讀計算機的我來說感覺比較迷惑的。在管理學，經濟學，計算機這三門學科在解決優化問題的時候採用的方法大致相同，其核心都是統計學，管理學，電腦科學中採用的基礎方法，如線性迴歸，多元線性迴歸，廣義線性迴歸，決策樹，SVM,ID3,KNN等分類方法

(轉) 專案經理問：我怎麼有做不完的事情 – 事件籃方法

轉載，http://blog.csdn.net/yihui823/article/details/6826353 時間管理，本身就是一門藝術。時間是最公平的，每個人的時間都是一樣的。如何在相同的時間裡，做出不同的事業，這就是個人水平的體現。一、故事這裡先講一個

用逗號分隔引數不太科學——S表示式才是王道

最近在寫php程式和sql語句時用到了這種寫法： select a ,b ,c from table where a='1' AND b='2' OR c='3' <?php fn(1

win10無法使用pin登錄怎麽辦？Win10 PIN碼不能用解決方法

windows 微軟密碼 win10無法使用pin登錄，Win10 PIN碼登錄失效怎麽辦，Win10 PIN碼不能用的解決方法是什麽，PIN密碼是從Win8開始Windows中新增加的一種登錄認證方式，也是微軟極力推薦的一種登錄方式。在Win10的安裝過程中，微軟會提示用戶傳統密碼已經過時，推

java創建一個子類對象是會調用父類的構造方法會不會創建父類

進行 eight 實現知識創建 mod 不一定調用構造方法結構 1、子類在創建實例後，類初始化方法會調用父類的初始化方法(除了Java.lang.Object類，因為java.lang.Object類沒有父類)，而這種調用會逐級追述，直到java.lang.Obj

scala中隱式轉換之隱式轉換調用類中本不存在的方法

esc rip args root imp 轉換存在 val 轉換成 /** * Created by root * Description : 隱式轉換調用類中本不存在的方法 */ class Person(name : String){ def g

jquery ajax success 函數異步調用方法中不能給全局變量賦值的原因及解決辦法

tex span var getc res syn ucc 解決辦法 asp 在調用一個jquery的ajax方法時我們有時會需要該方法返回一個值或者給某個全局變量賦值，可是我們發現程序執行完後並沒有獲取到我們想要的值，這時很有可能是因為你用的是ajax的異步調用async

[用科學的方法做不科學的事情繫列]---分析五百萬大獎-雙色球之花落誰家?(1)

獲取資料

環境搭建

相關推薦