1. 程式人生 > >使用wget命令爬取整站

使用wget命令爬取整站

TP 抓取 boot 下載圖片 windows mce 使用 外部 -c

快速上手(整個bootstrap網頁全被你抓取下來了~_~)

wget -c -r -npH -k -nv http://www.baidu.com

參數說明

-c:斷點續傳

-r:遞歸下載

-np:遞歸下載時不搜索上層目錄

-nv:顯示簡要信息

-nd:遞歸下載時不創建一層一層的目錄,把所有文件下載當前文件夾中

-p:下載網頁所需要的所有文件(圖片,樣式,js文件等)

-H:當遞歸時是轉到外部主機下載圖片或鏈接

-k:將絕對鏈接轉換為相對鏈接,這樣就可以在本地脫機瀏覽網頁了

啟用地址偽裝

-user-agent="Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4482.400 QQBrowser/9.7.13001.400"

使用wget命令爬取整站