python爬取股票資料
阿新 • • 發佈:2019-02-12
今天主要給大家介紹的是使用python爬取網易財經模組股票的歷史資料.先來介紹一下環境:
原始文件:http://mp.weixin.qq.com/s/18H_MYCKT3MMXM13WQCOqQ
1、版本:python2.7
2、使用beautisoup模組
以仙珺製藥(股票程式碼:002332)為例,首先開啟獲取歷史股票行情的網頁,網頁地址為:http://quotes.money.163.com/trade/lsjysj_002332.html?year=2017&season=1本文主要獲取從上市時間到目前為止所有的行情資料.網頁截圖為如下:
網頁原始碼如下:下面就是使用python爬取資料資訊
爬取資料為分為一下幾個步驟:
def down_load(url,try_times=2): req = urllib2.Request(url) try: response = urllib2.urlopen(req) html = response.read() return html except urllib2.URLError as e: print 'down error',e.reason html = None if try_times > 0 : if hasattr(e, 'code') and 500 <= e.code < 600: return download(url,try_times-1)
3、解析網頁,儲存檔案,解析網頁主要是用beautifulsoup.具體如下:
soup_pakge = BeautifulSoup(html)
#解析html先解析表頭
#print(HEADERS)
soup_head=soup_pakge.findAll('table','table_bg001 border_box limit_sale')
爬取的資料結果如下:
獲取原始碼請關注公眾號(CPPguy),傳送:股票.就會接收到下載程式碼的連結和密碼.
原始文件:http://mp.weixin.qq.com/s/18H_MYCKT3MMXM13WQCOqQ