正則表示式擷取URL引數
阿新 • • 發佈:2019-02-09
最近在寫個爬蟲,要去爬一些網站獲得資料,這個過程中遇到字串擷取的問題,超哥指點了我,幫了個大忙啊
http://regexpal.com/還有http://www.regexr.com/這兩個網站可以測試你的正則表示式~
除此之外,谷歌瀏覽器的開發者工具也很好用,F12後在console裡面可以直接進行操作
例如:http://market.scau.edu.cn/goods.php?iid=1407246132s7jn1j8b&iaction=view&st=0f 這樣一個字串,我要取得 iid
在console裡面輸入 var item =" http://market.scau.edu.cn/goods.php?iid=1407246132s7jn1j8b&iaction=view&st=0f"
item.match(/iid=([0-9a-z]+)&iaction=(\w+)&st=(\w+)/)
會返回 ["iid=1407246132s7jn1j8b&iaction=view&st=0f", "1407246132s7jn1j8b", "view", "0f"] 這樣一個數組
利用捕獲可以簡單方便得獲得想要的字元。