Python中過濾Windows檔名中的非法字元
阿新 • • 發佈:2019-02-03
網上有三種寫法:
第一種(所有非法字元都不轉義):
def setFileTitle(self,title):
fileName = re.sub('[\/:*?"<>|]','-',title)#去掉非法字元
self.file = open(fileName + ".txt","w+")
\非法字元必須轉義,否則\/被解釋為/
第二種(所有非法字元都轉義):
def validateTitle(title):
rstr = r"[\/\\\:\*\?\"\<\>\|]" # '/ \ : * ? " < > |'
new_title = re.sub(rstr, "_", title) # 替換為下劃線
return new_title
第三種(部分非法字元轉義):
private static Pattern FilePattern = Pattern.compile("[\\\\/:*?\"<>|]");
public static String filenameFilter(String str) {
return str==null?null:FilePattern.matcher(str).replaceAll("");
}
最佳寫法:
pattern=r'[\\/:*?"<>|\r\n]+'
在[]中*不需要轉義,此時*不表示多次匹配,就表示本身的字元
注意
資料夾名和檔名的字串中可以包含不是26個字母和數字的特殊字元,例如“┽┾┿╀╂╁╃ ”這個字串是可以命名成功的的,另一方面檔名首尾的空格要去掉,首尾的點號要去掉,特殊的空白符(如換行符和製表符)也要去掉。
python中strip(),lstrip(),rstrip()可以取出兩端的某些特殊的字元。