python遞迴下載資料夾下所有檔案

阿新 • • 發佈：2020-01-09

最近想備份網站，但是php下載檔案的大小是有大小限制的，而我也懶得裝ftp再下載了，就想著暫時弄個二級域名站，然後用python(python3)的requests庫直接下載網站根目錄下的所有檔案以及資料夾。（0-0就是這麼任性）

1.安裝requests庫

pip install requests

2.下載資料夾下所有檔案及資料夾

這裡需要處理的地方主要是資料夾，這裡我們判斷出該連結是資料夾時，自動建立資料夾，並遞迴繼續進行操作，否則判斷該連結是檔案，直接使用requests get方法下載，話不多說，看程式碼

####春江暮客 www.bobobk.com
import requests
import re
import os
import sys
def help(script):
 text = 'python3 %s https://www.bobobk.com ./' % script

 print(text)
def get_file(url,path):##檔案下載函式
  content = requests.get(url)
  print("write %s in %s" % (url,path))
  filew = open(path+url.split("/")[-1],'wb')
  for chunk in content.iter_content(chunk_size=512 * 1024): 
    if chunk: # filter out keep-alive new chunks
      filew.write(chunk)
  filew.close()
def get_dir(url,path): #資料夾處理邏輯
  content = requests.get(url).text
  if "<title>Index of" in content:
    sub_url = re.findall('href="(.*?)" rel="external nofollow" ',content)
  
    print(sub_url)
    for i in sub_url:
      if "/" in i:
      
        i = i.split("/")[0]
        print(i)
        if i!="." and i!="..":
          
          if not os.direxists(path+i):
            os.mkdir(path+i)
         
          get_dir(url+"/"+i,path+i+"/")
          print("url:"+url+"/"+i+"\nurl_path:"+path+i+"/")
      else:
        get_file(url+"/"+i,path)
  else:
    get_file(url,path)
if __name__ == '__main__':
 if not sys.argv[1]:
 help(sys.argv[0])
 exit(0)
 else:
 get_dir(sys.argv[1],"./")

至此，就在本地目錄完全還原下載原網站的路徑和檔案了。

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支援我們。

python遞迴下載資料夾下所有檔案

最近想備份網站，但是php下載檔案的大小是有大小限制的，而我也懶得裝ftp再下載了，就想著暫時弄個二級域名站，然後用python(python3)的requests庫直接下載網站根目錄下的所有檔案以及資料夾。（0-0就是這麼任性）

Java File 利用遞迴得到資料夾下所有檔案

技術標籤：Io流java程式人生後端windows大資料 Java File 利用遞迴得到資料夾下所有檔案

Unity 獲取指定路徑資料夾下所有檔案集合（遞迴寫法）（二）

方法程式碼的使用： private List<string> fileList = new List<string>(); /// <summary>

Qt遞迴刪除資料夾下的所有檔案，而不刪除自己

技術標籤：Qtqt遞迴刪除資料夾不刪除自己 Qt遞迴刪除資料夾下的所有檔案，而不刪除自己

Java獲取資料夾下所有檔案(遞迴)

技術標籤：java學習java Java使用遞迴獲取指定目錄下所有檔案話不多說直接上程式碼

python實現遞迴查詢某個路徑下所有檔案中的中文字元

本文例項為大家分享了python實現遞迴查詢某個路徑下所有檔案中的中文字元，供大家參考，具體內容如下

python批量上傳本地資料夾下所有檔案 - 工作筆記

from urllib import parse#用於encode url中的folder引數 import requests#使用者requests.post 提交post請求

C++ 遍歷某個資料夾下所有檔案的方法步驟

本文主要介紹了C++ 遍歷某個資料夾下所有檔案的方法步驟，分享給大家，主要給自己留個筆記。。

Java遍歷資料夾下所有檔案並重新命名

本文例項為大家分享了Java遍歷資料夾下所有檔案並重命名的具體程式碼，供大家參考，具體內容如下

Linux_mv命令移動資料夾下所有檔案以及“Argument list too long”問題的解決方法

技術標籤：Linuxlinux深度學習機器學習資料探勘神經網路在平時整理檔案的時候，需要將一個資料夾下的所有或者指定型別的檔案移動到另一個資料夾中，我們可以使用mv命令。

Linux C 讀取資料夾下所有檔案（包括子資料夾）的檔名

技術標籤：linuxopendirreaddir https://www.cnblogs.com/fnlingnzb-learner/p/6472391.html Linux C 下面讀取資料夾要用到結構體struct dirent，在頭#include <dirent.h>中，如下：

C#獲取資料夾下所有檔案

1.我們先在cmd下看一下資料夾的樹結構 tree /f 2.新建一個控制檯程式，將獲取的所有檔案打印出來，程式碼如下：

C#.net多執行緒並行處理例項：處理資料夾及巢狀資料夾下所有檔案內容字串

需求某系統的邏輯資料庫表結構以檔案形式儲存，為了分析該資料庫及表結構，需對各表文件進行處理，儲存到指定表中以供分析。

Java獲取資料夾下所有檔案的名稱

public static void getFileName() { String path = \"F:/測試目錄\"; // 路徑 File f = new File(path);//獲取路徑F:\\測試目錄

halcon-list_files讀取資料夾下所有檔案路徑

在HDevelop中 list_files(\'D:/bb/tu\',\'files\',files) *作用:列出資料夾中的所有檔案路徑

Python使用遞迴+遍歷讀取資料夾下所有docx檔案

技術標籤：Python基礎知識python 文章目錄思路資料夾結構遞迴+遍歷讀取想要的檔案

linux 下python多執行緒遞迴複製資料夾及資料夾中的檔案

本文是利用python 複製資料夾剛開始寫了一個普通的遞迴複製資料夾然後想了想覺得對io頻繁的程式 threading 執行緒還比較友好就寫了個多執行緒版本的最噁心人的地方就是路徑其他都還好吧

遞迴遍歷資料夾獲取所有檔案的絕對路徑

import java.io.File; import java.util.HashSet; import java.util.Set; /** * 遞迴獲取所有檔案並列印以\".txt\"格式結尾的檔案絕對路徑

如何使用python 新建資料夾以及遞迴建立資料夾

轉載：如何使用python 新建資料夾以及遞迴建立資料夾 | 酷python (coolpython.net) 1. os.mkdir

python批量修改一個資料夾下含多個資料夾中的所有圖片名稱

網上能找到的，大多是隻對一個資料夾下所有圖片進行重新命名的程式碼。這邊實現的是，一個資料夾下有多個資料夾內圖片的重新命名。