學會用Python統計彩票熱門資料,衝擊人生第一桶金?
又是一週的星期五了,離彩票的開獎時間還有兩天,剛好趁機來分析下彩票,以備過兩天的彩票開獎。因此,準備了兩個指令碼,一個用來下載最近的彩票資料,一個用來統計彩票數字,分享給大家!
一、彩票資料獲取並寫入excel表格
資料來源自己看吧~用外鏈通不過。。。
所用庫:xlwt,requests,lxml
有幾點需要注意的:
1、構建列表。因為存入excel檔案的時候用的是列表,所以新建一個函式,分別取網頁5個數據:時間、期數、開獎數123,然後每一頁巢狀寫入列表類似結構為[[時間、期數、開獎數1,2,3],[時間、期數、開獎數1,2,3]……],在迴圈頁數,獲取所有的資料!注意構建列表的形式和列表結果,這個在你寫入表格的時候很重要!
2、寫入資料。xlwt寫入檔案的方法為ws.write(行,列,資料),按行寫入檔案,所以新建一個變數line(程式碼第36行),每寫入一行自增1。
其他方面都很簡單,沒有反爬,就是為了獲取資料,好做分析!
最後excel表中的資料
是這樣的:
最後大概有4840行資料,足夠我們分析的了!
二、資料處理
用xlrd庫就可以~話說xlwt庫和xlrd庫好像就是一個寫資料,一個讀資料。。。
就寫了一個抓熱門數字的,也就是取頻率最高的。如果您有更好的想法或者玩法,可以自行去實現哦!
先讀取資料,然後取到每一行的2.3.4列,每一列寫入一個列表(現在有些後悔,不該寫那麼多資料進來),然後3個列表合併一個總列表,這樣我們就有了4個列表,取出每一個列表中出現次數最多的那個數字,程式碼如下:
第1個數字頻率最高的是 [3]
第2個數字頻率最高的是 [6]
第3個數字頻率最高的是 [8]
單個數字頻率最高的是 [3]
因為有點偷懶。。。所以就全部用了列表推導式,也沒有用pandas庫或者視覺化庫做出很炫酷的圖表,等我研究出完美的預測方案的時候在做【手動哭泣】,不過依現在的走勢,是沒什麼希望了。。。
最後想要和大家分享的是,從開始研究分析各種資料到現在按慣例買彩票,沒中過一次大獎(超過200都算大獎,可能也是人有點衰)!所以大家還是得頭腦清醒點,要知道天上不會掉餡餅的。。。。。分享到此告一段落!喜歡本文的小夥伴或者覺得本文對你有幫助可以點播關注或轉發。
最後
小編精心推薦一個學習Python的好去處,如果有想學Python的,或者想與小編交流的小夥伴可以加群959997225或加小編QQ2789278246!
本文來自網路,如有侵權,請聯絡小編刪除!