爬蟲實戰篇---12306搶票爬蟲
阿新 • • 發佈:2018-06-09
spi 進行 presence 查詢 IV 思路 .com 信息 mit
(1)、前言
(此代碼經過我的實測具有較強的實用型)每逢佳節,大家對於回家搶票這件事是不是特別頭疼呢?今天我在網上發現了這個代碼,通過一天的學習,與大家分析下,大家可以直接拿來進行12306搶票,也可以進行優化,進行諸如演唱會的搶票,等等。該代碼主要使用了模擬瀏覽器方式而並沒有采用分析請求。
(2)、技術路線
selenium + chromedriver
(3)、思路分析
1、模擬瀏覽器登錄搶票界面,手動進行登錄
2、登錄完成後讓瀏覽器跳轉到購票界面
3、手動輸入出發地、目的地、 出發日,檢查上面三個信息輸入完成後,找到查詢按鈕,進行車次查詢
4、查找我們需要的車次,看下是否有余票(顯示有或數子),找到車次的預定的按鈕,進行點擊,如果沒有以上兩種情況出現,就循環查詢
5、一旦檢查到有票,執行預定按鈕的點擊事件,找到乘客信息,執行點擊事件,再找到提交訂單按鈕,執行點擊事件
6、點擊完提交訂單按鈕,會彈出確認的對話框,找到確認按鈕,執行點擊事件,完成搶票
7、之後完成付款操作
(4)、全部代碼
1 #author: "xian" 2 #date: 2018/6/9 3 #使用selenium是不保存登錄信息的(cookies) 4 from selenium import webdriver 5 from selenium.webdriver.support.ui import WebDriverWait 6 fromselenium.webdriver.support import expected_conditions as EC #期望的條件 7 from selenium.webdriver.common.by import By 8 9 10 11 class Qiangpiao(object): 12 #初始化函數 13 def __init__(self): 14 self.login_url = ‘https://kyfw.12306.cn/otn/login/init‘ 15 self.initmy_url = ‘https://kyfw.12306.cn/otn/index/initMy12306‘ 16 self.search_url = ‘https://kyfw.12306.cn/otn/leftTicket/init‘ 17 self.confirmPassenger = ‘https://kyfw.12306.cn/otn/confirmPassenger/initDc‘ 18 self.driver = webdriver.Chrome() #驅動chrome瀏覽器進行操作 19 20 def wait_input(self): 21 self.from_station = input(‘出發地:‘) 22 self.to_station = input(‘目的地:‘) 23 #時間格式一定要對應 24 self.depart_time = input(‘出發時間:‘) 25 #名字一定要存在於常用聯系人中間 26 self.passengers = input(‘乘客姓名:(如有多個乘客使用英文逗號分割)‘).split(‘,‘) 27 self.trains = input(‘車次:(如有多個車次使用英文逗號分割)‘).split(‘,‘) #結果[G234,...] 28 29 #_login只想在類中調用 30 def _login(self): 31 self.driver.get(self.login_url) #打開登錄界面 32 #顯示等待(解釋:你與心上人約會,以對方來或不來為等待條件即事件是否發生為條件) 33 #隱示等待(解釋:你與心上人約會,以等待時間為條件) 34 WebDriverWait(self.driver,1000).until(EC.url_to_be(self.initmy_url)) 35 print(‘恭喜您,您已登錄成功了!‘) 36 37 38 def _order_ticket(self): 39 #1、跳轉到查余票的界面 40 self.driver.get(self.search_url) 41 #2、等待出發地是否輸入正確 42 WebDriverWait(self.driver ,1000).until(EC.text_to_be_present_in_element_value((By.ID,"fromStationText"),self.from_station)) 43 #3、等待目的地是都輸入正確 44 WebDriverWait(self.driver, 1000).until(EC.text_to_be_present_in_element_value((By.ID,"toStationText"),self.to_station)) 45 #4、等待出發日期是否輸入正確 46 WebDriverWait(self.driver, 1000).until(EC.text_to_be_present_in_element_value((By.ID,"train_date"),self.depart_time)) 47 #5、等待查詢按鈕是否可用 48 WebDriverWait(self.driver, 1000).until(EC.element_to_be_clickable((By.ID, "query_ticket"))) 49 #6、如果可以點擊找到查詢按鈕執行點擊事件 50 searchBotton = self.driver.find_element_by_id("query_ticket") 51 searchBotton.click() 52 #7、點擊查詢按鈕之後等待車票信息頁面被加載完成 53 WebDriverWait(self.driver, 1000).until(EC.presence_of_element_located((By.XPATH,".//tbody[@id = ‘queryLeftTable‘]/tr"))) 54 #8、找到所有沒有datatrain屬性的tr標簽 55 tr_list = self.driver.find_elements_by_xpath(".//tbody[@id =‘queryLeftTable‘]/tr[not(@datatran)]") 56 #9、遍歷所有滿足條件的tr標簽 57 for tr in tr_list: 58 train_number = tr.find_element_by_class_name(‘number‘).text 59 if train_number in self.trains: 60 left_ticket = tr.find_element_by_xpath(‘.//td[3]‘).text #找到第四個td標簽下的文本 61 if left_ticket == ‘有‘ or left_ticket.isdigit: #判斷輸入的車次是否在列表中 62 orderBotton = tr.find_element_by_class_name(‘btn72‘) 63 orderBotton.click() 64 65 #等待是否來到乘客確認頁面 66 WebDriverWait(self.driver, 1000).until(EC.url_to_be(self.confirmPassenger)) 67 #等待所有的乘客信息被加載完畢 68 WebDriverWait(self.driver, 1000).until(EC.presence_of_element_located((By.XPATH,".//ul[@id = ‘normal_passenger_id‘]/li"))) 69 #獲取所有的乘客信息 70 passanger_labels = self.driver.find_elements_by_xpath(".//ul[@id = ‘normal_passenger_id‘]/li/label") 71 for passanger_label in passanger_labels: #遍歷所有的label標簽 72 name = passanger_label.text 73 if name in self.passengers:#判斷名字是否與之前輸入的名字重合 74 passanger_label.click() #執行點擊操作 75 76 #獲取提交訂單的按鈕 77 submitBotton = self.driver.find_element_by_id(‘submitOrder_id‘) 78 submitBotton.click() 79 #顯示等待確人訂單對話框是否出現 80 WebDriverWait(self.driver, 1000).until(EC.presence_of_element_located((By.CLASS_NAME,‘dhtmlx_wins_body_outer‘))) 81 #顯示等待確認按鈕是否加載出現,出現後執行點擊操作 82 WebDriverWait(self.driver, 1000).until(EC.presence_of_element_located((By.ID,‘qr_submit_id‘))) 83 ConBotton = self.driver.find_element_by_id(‘qr_submit_id‘) 84 ConBotton.click() 85 while ConBotton: 86 ConBotton.click() 87 ConBotton = self.driver.find_element_by_id(‘qr_submit_id‘) 88 89 return 90 91 92 93 94 95 96 97 98 def run(self): 99 self.wait_input() 100 self._login() 101 self._order_ticket() 102 103 if __name__ == ‘__main__‘: 104 spider = Qiangpiao() 105 spider.run()
(5)、運行效果圖
之後大家只要在30分鐘之內完成在線支付即可,方便實用!
(6)、使用說明
請使用前確保已安裝好一個python編譯器並完成pyhon的配置windows下推薦使用pycharm,並下載chrome和chromedriver驅動,並將chromedriver配置進python包(如果沒配置只要指定路徑亦可!)
復制代碼按命令行提示操作即可完成搶票
爬蟲實戰篇---12306搶票爬蟲