1. 程式人生 > 其它 >python中os.walk的用法詳解(轉載)

python中os.walk的用法詳解(轉載)

python中os.walk是一個簡單易用的檔案、目錄遍歷器,可以幫助我們高效的處理檔案、目錄方面的事情。

1.載入
要使用os.walk,首先要載入該函式

可以使用以下兩種方法

  • import os
  • from os import walk

 

2.使用

os.walk的函式宣告為:

walk(top, topdown=True, οnerrοr=None, followlinks=False)

引數

  • top 是你所要便利的目錄的地址
  • topdown 為真,則優先遍歷top目錄,否則優先遍歷top的子目錄(預設為開啟)
  • onerror 需要一個 callable 物件,當walk需要異常時,會呼叫
  • followlinks 如果為真,則會遍歷目錄下的快捷方式(linux 下是 symbolic link)實際所指的目錄(預設關閉)

os.walk 的返回值是一個生成器(generator),也就是說我們需要不斷的遍歷它,來獲得所有的內容。

 

每次遍歷的物件都是返回的是一個三元組(root,dirs,files)

  • root 所指的是當前正在遍歷的這個資料夾的本身的地址
  • dirs 是一個 list ,內容是該資料夾中所有的目錄的名字(不包括子目錄)
  • files 同樣是 list , 內容是該資料夾中所有的檔案(不包括子目錄)

如果topdown 引數為真,walk 會遍歷top資料夾,與top資料夾中每一個子目錄。

 

3、舉個例子

如果我們有如下的檔案結構

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 for (root, dirs, files) in os.walk('a'):     #第一次執行時,當前遍歷目錄為 a     所以 root == 'a'          dirs == [ 'b''c''d']          files == [ '4.txt''5.txt']           。。。        # 接著遍歷 dirs 中的每一個目錄
    b:  root  = 'a\\b'         dirs  = []         files = [ '1.txt''2.txt']           # dirs為空,返回     # 遍歷c     c:  root  = 'a\\c'         dirs  = []         files = [ '3.txt' ]           PS : 如果想獲取檔案的全路徑,只需要     for in files:         path = os.path.join(root,f)           # 遍歷d     d:  root  = 'a\\b'         dirs  = []         files = []        遍歷完畢,退出迴圈

4、實際使用 保持目錄 a 的目錄結構,在 b 中建立對應的資料夾,並把a中所有的檔案加上字尾 _bak

import os
 
Root = 'a'
Dest = 'b'
 
for (root, dirs, files) in os.walk(Root):
    new_root = root.replace(Root, Dest, 1)
    if not os.path.exists(new_root):
        os.mkdir(new_root)
    
    for d in dirs:
        d = os.path.join(new_root, d)
        if not os.path.exists(d):
            os.mkdir(d)
    
    for f in files:
        # 把檔名分解為 檔名.副檔名
        # 在這裡可以新增一個 filter,過濾掉不想複製的檔案型別,或者檔名
        (shotname, extension) = os.path.splitext(f)
        # 原檔案的路徑
        old_path = os.path.join(root, f)
        new_name = shotname + '_bak' + extension
        # 新檔案的路徑
        new_path = os.path.join(new_root, new_name)
        try:
            # 複製檔案
            open(new_path, 'wb').write(open(old_path, 'rb').read())
        except IOError as e: