1. 程式人生 > >正則表示式擷取URL引數

正則表示式擷取URL引數

最近在寫個爬蟲,要去爬一些網站獲得資料,這個過程中遇到字串擷取的問題,超哥指點了我,幫了個大忙啊

http://regexpal.com/還有http://www.regexr.com/這兩個網站可以測試你的正則表示式~

除此之外,谷歌瀏覽器的開發者工具也很好用,F12後在console裡面可以直接進行操作

例如:http://market.scau.edu.cn/goods.php?iid=1407246132s7jn1j8b&iaction=view&st=0f 這樣一個字串,我要取得 iid

   在console裡面輸入 var item =" http://market.scau.edu.cn/goods.php?iid=1407246132s7jn1j8b&iaction=view&st=0f"

          item.match(/iid=([0-9a-z]+)&iaction=(\w+)&st=(\w+)/)

     會返回 ["iid=1407246132s7jn1j8b&iaction=view&st=0f", "1407246132s7jn1j8b", "view", "0f"] 這樣一個數組

利用捕獲可以簡單方便得獲得想要的字元。