1. 程式人生 > >利用NodeJS抓取Script程式碼和html元素內容的方法

利用NodeJS抓取Script程式碼和html元素內容的方法

    superagent.get(Url)
    .end(function (err, response) {
        if (err) {
          return console.error(err);
        }
        var topicUrls = [];
        var $ = cheerio.load(response.text);
        $('#twisterJsInitializer_feature_div>script').each(function () {
            var script = $(this).html();
            // script就是js程式碼了
            // console.log(script);
 //商品價格
                     price = $('#priceblock_ourprice').text().trim();
                    //商品名稱
                    name = $('#productTitle').text().trim();
                    //尺寸
                    size = $('#dropdown_selected_size_name>span>span').text().trim();
                    //顏色
                    color = $('#variation_color_name>div>span').text().trim();
                    // 打折資訊
                    discount = $('#applicable_promotion_list_sec>table>tr>td>span[3]>span>a[2]>span>span>span').text().trim();
以上是利用nodejs來抓取網頁中的script檔案和部分html元素內容的方法