八爪魚采集教程——房源信息采集
阿新 • • 發佈:2017-09-07
color 內容 solid initial ext spa 網站 當前 創建
說明:本地采集占用當前電腦資源進行采集,如果存在采集時間要求或當前電腦無法長時間進行采集可以使用雲采集功能,雲采集在網絡中進行采集,無需當前電腦支持,電腦可以關機,可以設置多個雲節點分攤任務,
介紹使用八爪魚7.0采集安居客網頁信息的方法(以深圳寫字樓為例)
使用功能點:
l 分頁列表頁信息采集
步驟1:創建采集任務
進入主界面選擇,選擇自定義模式
將上面網址的網址復制粘貼到網站輸入框中,點擊“保存網址”
保存網址後,頁面將在八爪魚采集器中打開,紅色方框中的列表內容,就是演示采集數據
步驟2:創建翻頁循環
l 找到翻頁按鈕,設置翻頁循環
將頁面下拉到底部,找到下一頁按鈕,鼠標點擊,在右側操作提示框中,
選擇“循環點擊下一頁”
步驟3:房源信息采集
l 選中需要采集的字段信息,創建采集列表
l 編輯采集字段名稱
如圖,移動鼠標選中列表裏一個房源方框,右鍵點擊
註意:點擊右上角的“流程”按鈕,即可展現出可視化流程圖。
列表中所有適配內容會被選中,在右側操作提示框中,查看提取的字段,可以將不需要的字段刪除,然後點擊“選中子元素”
註意: 鼠標放在該字段上會出現一個刪除標識,點擊即可刪除該字段。
點擊“選中全部”,將頁面中所有方框中的信息添加到列表中
點擊“采集以下數據”
修改采集字段名稱,點擊下方紅色方框中的“保存並開始采集”
根據采集的情況選擇合適的采集方式,這裏選擇“啟動本地采集”
說明:本地采集占用當前電腦資源進行采集,如果存在采集時間要求或當前電腦無法長時間進行采集可以使用雲采集功能,雲采集在網絡中進行采集,無需當前電腦支持,電腦可以關機,可以設置多個雲節點分攤任務, 10個節點相當於10臺電腦分配任務幫你采集,速度降低為原來的十分之一;采集到的數據可以在雲上保存三個月,可以隨時進行導出操作。
步驟4:數據采集及導出
采集完成後,會跳出提示,選擇導出數據
選擇合適的導出方式,將采集好的數據導出
八爪魚采集教程——房源信息采集