Selenium 使用 Chrome 瀏覽器 webdriver
說明:點2下 ex3.exe 執行檔,Windows會使用chrome瀏覽器開啟中央氣象局網站。
Step 1:要安裝 python
附註1:如果是 Linux 或 MacOS 平臺,可以略過 Step1,因為內建就有 python, python2 或 python3 都可以,不限定版本。
附註2:除了python 如果你懂其他程式語言(例如:java)也可以實作,不限於python程式語言,大同小異)
Step 2:要安裝 pip
附註:這個太簡單,如果你的電腦裡沒有pip 指令,自行google 看看如何安裝。
Step 3:安裝selenium套件,請執行指令:
pip install selenium
如果在 Linux 或 MacOS 平臺裡執行pip install 失敗,請先pip install virtualenv. 我自己本身是使用 macOS, 一開始是無法安裝,使用 virtualenv,是一定可以跑,後來不知道修改到什麼,變成不用進入 venv 環境裡也可以直接執行。
如果是 Windows平臺,請直接跳到 Step 4.
Step 4:下載ChromeDriver
ChromeDriver 說明:
ChromeDriver 下載頁面:
附註1:ChromeDriver目前有支援 Linux 64bit / macOS 64bit / Windows 32bit (64bit 也可以執行 32bit程式)
附註2:除了有 ChromeDriver 還有 SafariDriver 可以讓 Selenium Server 呼叫 Safari 瀏覽器來執行,參考看看 Safari Extension,建議使用ChromeDriver即可。
太舊的 chrome 執行起來會有問題,請先更新chrome瀏覽器為最近的版本,更新方式為:「設定」->「關於Chrome」。
完成 step 3 的 selenium 的安裝,和 step 4 下載ChromeDriver 之後,先試看看這個sample code:
from selenium import webdriver chromedriver = "/Users/max/Documents/chromedriver" driver = webdriver.Chrome(chromedriver) driver.get("")
說明1:這個ChromeDriver 路徑請換成您電腦實際下載的資料夾。
說明2:這個範例會開一個新的 chrome 視窗並連到網址
附註:目前的範例是透過 python 去控制 selenium + chromedriver,如果你懂其他的程式語言,也是可以實作的出來,異曲同工。
範例 2 號:
from selenium import webdriver chromedriver = "/Users/max/Documents/chromedriver" driver = webdriver.Chrome(chromedriver)driver.get('') driver.set_window_position(0,0) #瀏覽器位置 driver.set_window_size(700,700) #瀏覽器大小 driver.find_element_by_link_text('天氣預報').click() #點選頁面上"天氣預報"的連結
範例 2 號使用的是find_element_by_link_text(),還有許多方法如下:
find_element_by_name() find_element_by_id() find_element_by_tag_name() find_element_by_partial_link_text() find_element_by_css_selector()
area = el.find_element(By.TAG_NAME, “a”)
光世代有分300M/100M,100m/40m,請知道的是如果在同樣的操作環境,人也一樣,那300m的會不會比100m的更高的機率買到票? 到底什麼是比別人快買到票的關鍵因素?? 售票系統的運作原理是什麼? 為何我的手速也很快了,但為什麼一進去票就是都被買了?他們到底是什麼原因比我快進去,快送出購票請求??
買票前建議先試著去買其他表演,事先下載好購票網頁會使用到的 javascript 和 css 檔案,可以透過離線檔案的快取(cache) 加速網頁的反應時間。
建議使用chrome 瀏覽器來搶票,反應時間會快一點。
「售票系統的運作原理」不難,google 一下就可以看到大量的實作和原理教學,在這裡就不詳述。以目前常見的網頁相關技術來說,在網路上大型的網站實作原理都大同小異,大致上會使用負載平衡(load balance)架構分散主機的網頁流量和要求,通常是(但不是絕對)在資料庫的伺服器那一段程式碼來決定那一個要求可以買到票的,大多數伺服器在處理排隊(queue)的要求是先進先出(first in first out),所以如果你的網路早一點下載完網頁,早一點執行完javascript,早一點送出搶票的要求,理論上搶到票的機率會高一點。
Q:您提到,拓元有分 detail 和 game, 連到game的網址,搶票才會快,假如一開始時間還沒到,「立即購票」的按鈕根本還沒出現,用這個方法,要怎麼使用呢??
A:detail 網址和 game 網址是一樣的,是獨立的,在購票流程裡你可以對可以購票的場次各使用 detail 和 game 網址去訂一次票,就可以知道其中差異,速度上 game 網址也可以買到票,由於傳回的網頁裡的資訊還有所執行的javascript較少,理論上也許會快幾個毫秒。
Q:用搶票機器人,跟手動的差別? 這個問題主要是問,機器人的速度跟用手動的速度,會差距明顯嗎?手的速度能不能贏過機器人?
目前有執行檔,不懂程式的人可以在 Windows/Mac/Linux 平臺上可以直接執行。
A:請先學會如何透過python 程式自動去點畫面上的按鈕,或使用點2下就可以跑的執行檔。
A:python會全開啟一個全新的視窗,請使用該視窗去登入 Google/Facebook/Pixel Pin.
A:Windows 也可以使用哦。而且語法相同。ChromeDriver目前有支援 Linux 64bit / macOS 64bit / Windows 32bit (64bit 也可以執行 32bit程式)檔案下載:
while True: time.sleep(0.2) url = "" try: url = driver.current_url except Exception as exc: pass if url is None: continue else: if len(url) == 0: continue print(url)
Q:google提供的擴充附件外掛 官方是不是會查出來?
如果有一個html 長的像醬子:
該按鈕的 html code:
<input class="btn btn-next" data-href="/ticket/area/18_RBTW/4029" name="yt0" type="button" value="立即訂購">
要取到該按鈕的 python code:
el = driver.find_element_by_css_selector('.btn-next')
讓按鈕產生點選的事件的 python code:
How to use the try/except with Selenium Webdriver when having Exceptions on Python
To be able to use required exception you have to import it first with correct name (NoSuchElement
-> NoSuchElementException
from selenium.common.exceptions import NoSuchElementException
except NoSuchElementException:
Using JavaScript
element = driver.execute_script("return $('.cheese')[0]")
設定 select 裡的值:
from import Select select = Select(driver.find_element_by_tag_name("select")) select.select_by_visible_text("Edam")
勾選 checkbox :
You can “toggle” the state of checkboxes, and you can use “click” to set
<input type="checkbox" value="1" name="TicketForm[agree]" id="TicketForm_agree">
python code:
el = driver.find_element(By.CSS_SELECTOR, '#TicketForm_agree')
driver.execute_script("$('#TicketForm_agree').prop('checked', true);")
附註:讓輸入框focus 請用 javascript:
這些是目前 WebDriver 支援的指令。 實際的原始碼,理論上不需要去看,大部份的人也看不懂
從目前的 source code 可以清楚的看到如何去使用 webdriver 物件。
下面的這個 chromedriver 切換 frame 的功能,如果你要是搶「熱門」的票,是遇不到的,熱門的場次都是「自動畫位」,所以不必自己去選坐位,自動選坐位會彈出在 iframe 裡,可以使用下面這行指令即可切換到選位的 iframe:
reference是傳入的引數,用來定位frame,可以傳入id、name、index以及selenium的WebElement物件,假設有如下HTML程式碼 index.html:
<html lang="en"> <head> <title>FrameTest</title> </head> <body> <iframe src="a.html" id="frame1" name="myframe"></iframe> </body> </html>
from selenium import webdriver driver = webdriver.Firefox() driver.switch_to.frame(0) # 1.用frame的index來定位,第一個是0 # driver.switch_to.frame("frame1") # 2.用id來定位 # driver.switch_to.frame("myframe") # 3.用name來定位 # driver.switch_to.frame(driver.find_element_by_tag_name("iframe")) # 4.用WebElement物件來定位
<iframe src="myframetest.html" />
<html> <iframe id="frame1"> <iframe id="frame2" / > </iframe> </html>
driver.switch_to.frame("frame1") driver.switch_to.frame("frame2")
driver.switch_to.parent_frame() # 如果當前已是主文件,則無效果
driver.switch_to.frame(reference) driver.switch_to.parent_frame() driver.switch_to.default_content()
如何在Server side(伺服器端)檢查使用者有沒開 chromedriver?
上面文章不用去看了,我檢查過新的版本的 selenium 完全不會多產生上面的 key 值。
拓元在 2018-05-12 之後更新的javascript 如下:
function order_check() { var count = valueCount(["WMeBWmQEOdoAKQq0wKU8kv4k5VcwA3GjyISDUmtPZek="]), maxQuota = 4; if(!$("#TicketForm_agree").prop("checked")) { alert("\u8acb\u5148\u8a73\u95b1\u4e14\u540c\u610f\u6703\u54e1\u670d\u52d9\u689d\u6b3e\u5f8c\u518d\u884c\u9001\u51fa\u52d5\u4f5c\u3002"); } else if (count > maxQuota) { alert("\u55ae\u7b46\u4ea4\u6613\u6700\u591a\u53ef\u8cb7 \" + maxQuota + \" \u5f35"); } else if (count == 0) { alert("\u8acb\u81f3\u5c11\u9078\u64c7\u4e00\u7a2e\u7968\u7a2e"); } else { var ticketType = ["WMeBWmQEOdoAKQq0wKU8kv4k5VcwA3GjyISDUmtPZek="], ticketTypeSelector = $("[name=\"" + ticketType.join("\"], [name=\"") + "\"]"); ticketTypeSelector.each(function() { $(this).attr("name", "TicketForm[ticketPrice][" + $(this).get(0).name + "]"); }); return true; } return false; } function valueCount(elements) { elements = countValById(elements); return elements.reduce(function(total, element) { return total + element; }, 0); } $("select[id=\"WMeBWmQEOdoAKQq0wKU8kv4k5VcwA3GjyISDUmtPZek=\"]").on("click", function(event) { if (!!event.originalEvent.isTrusted && !event.isTrigger) { $("#TicketForm_checked").attr("name", "TicketForm[ticketPrice][vQmwBD+sVq5AOWaOJrdiOQ5oIjAlhU38AxsBgnL1qkU=]"); } }); $("#TicketForm_agree").on("click", function(event) { if (!!event.originalEvent.isTrusted && !$(this).checked && !event.isTrigger) { $(this).attr("name", "TicketForm[agree][YnuMm9Vok/JcdY82p5pho4QaTg8m+p735VSWpPyjOfE=]"); } }) $("#TicketForm").on("change", function(event) { var ticketType = ["WMeBWmQEOdoAKQq0wKU8kv4k5VcwA3GjyISDUmtPZek="]; if (ticketType.indexOf( != -1) { var count = valueCount(ticketType), maxQuota = 4; if (count > maxQuota) { var num = parseInt($( + (maxQuota - count); alert("\u55ae\u7b46\u4ea4\u6613\u6700\u591a\u53ef\u8cb7 \" + maxQuota + \" \u5f35\uff0c\u60a8\u5171\u9078\u64c7\u4e86 \" + count + \" \u5f35"); while ($("option[value=" + num + "]").length < 1 && num != 0) { num--; } $(; } $("#ticketQuota").text(maxQuota - valueCount(ticketType)); } }); $("#TicketForm select").change();
<select class="mobile-select" name="WMeBWmQEOdoAKQq0wKU8kv4k5VcwA3GjyISDUmtPZek=" id="WMeBWmQEOdoAKQq0wKU8kv4k5VcwA3GjyISDUmtPZek="> <option value="0">0</option> <option value="1">1</option> <option value="2">2</option> <option value="3">3</option> <option value="4">4</option> </select>
driver.execute_script("$('#TicketForm_agree').prop('checked', true);")
並不會觸發 onclick 事件。請改服用:
form_checkbox = None try: form_checkbox = driver.find_element(By.ID, 'TicketForm_agree') if form_checkbox is not None: try: except Exception as exc: print "click TicketForm_agree fail" pass except NoSuchElementException: print "find TicketForm_agree fail"
附註, select box 比照 checkbox 的 code, 先產生 click 再去選取預期的張數即可。
2018年09月某一天 發現拓元的 javascript 又增加了幾個新的檢查點,javascript 如下:
function countValById(arr) { return { return parseInt($("[id=\"" + val + "\"]").val()); }); } function order_check() { var count = valueCount(["gqQB0FXCgar2OyOvqUFZR1xujK9R1sO+OR6V6m\/unzY="]), maxQuota = 4; if(!$("#TicketForm_agree").prop("checked")) { alert("\u8acb\u5148\u8a73\u95b1\u4e14\u540c\u610f\u6703\u54e1\u670d\u52d9\u689d\u6b3e\u5f8c\u518d\u884c\u9001\u51fa\u52d5\u4f5c\u3002"); } else if (count > maxQuota) { alert("單筆交易最多可買 " + maxQuota + " 張"); } else if (count == 0) { alert("\u8acb\u81f3\u5c11\u9078\u64c7\u4e00\u7a2e\u7968\u7a2e"); } else { var ticketType = ["gqQB0FXCgar2OyOvqUFZR1xujK9R1sO+OR6V6m\/unzY="], ticketTypeSelector = $("[name=\"" + ticketType.join("\"], [name=\"") + "\"]"); ticketTypeSelector.each(function() { $(this).attr("name", "TicketForm[ticketPrice][" + $(this).get(0).name + "]"); }); return true; } return false; } function valueCount(elements) { elements = countValById(elements); return elements.reduce(function(total, element) { return total + element; }, 0); } $(document).ready(function() { var ticketType = ["gqQB0FXCgar2OyOvqUFZR1xujK9R1sO+OR6V6m\/unzY="], ticketTypeSelector = "[id='" + ticketType.join("'], [id='") + "']"; $("#TicketForm_agree").attr("name", "TicketForm[agrees]"); $("#TicketForm_checked").attr("name", "TicketForm[ticketPrice][checks][ + $(ticketTypeSelector).length + ]"); ravenCheck(ticketTypeSelector); $("#TicketForm").on("mousedown click touchstart", ticketTypeSelector, function(event) { $("#TicketForm_checked").attr("name", "s_" + event.originalEvent.isTrusted + "_" + event.isTrigger); if (event.originalEvent.isTrusted !== false && !event.isTrigger) { $("#TicketForm_checked").attr("name", "TicketForm[ticketPrice][5BQBWTBCQoAEPama/ehw8qJhA1lkdF0fH8J5eua5HSw=]"); } }).on("mousedown click touchstart", "#TicketForm_agree", function(event) { $(this).attr("name", "s_" + event.originalEvent.isTrusted + "_" + event.isTrigger); if (event.originalEvent.isTrusted !== false && !$(this).checked &&