處理任意格式的文本文件
阿新 • • 發佈:2018-07-08
end 不存在 readlines 創建 去除 get 字典 更多 數據
# 內存--硬盤內容 序列話
# 手動擋
# f = open(‘文件名或類似文件的東西‘, ‘文件打卡模式‘)
# f是文件對象或指針,用來進行讀寫操作
# f.close()
# 三種模式:
# w. write 寫
# r read 讀
# a append 追加內容
import os
%pwd
‘C:\\study\\jupyter‘
f = open(‘coop.txt‘, ‘w‘) # 用w的方式打開文件,不存在則創建
f.write(‘coop‘ * 7) # 向文件寫入字符串
f.close()
with open(‘coop-1.txt‘, ‘w‘) as f: f.write(‘coop‘ * 7)
with open(‘coop.txt‘) as f: # 文件名後面的r是默認模式
data = f.read()# 讀出所有內容,保存到一個變量
print(data)
coopcoopcoopcoopcoopcoopcoop
# 在打開文件時要考慮此文件是否存在,使用try except
with open(‘coop.txt‘, ‘a‘) as f:
f.write(‘coop1\n‘)
f.write(‘coop2\n‘)
f.write(‘\n111‘)
f.write(‘\n222‘)
with open(‘coop.txt‘) as f: print(f.readline()) # 每次讀一行 print(f.readline()) print(f.readline()) print(f.readline())
coopcoopcoopcoopcoopcoopcoopcoop
coop
coop1
coop2
with open(‘coop.txt‘) as f: # 當文件不是很大時用readlines
print(f.readlines()) # 如何去掉\n
[‘coopcoopcoopcoopcoopcoopcoopcoop\n‘, ‘coop\n‘, ‘coop1\n‘, ‘coop2\n‘, ‘\n‘, ‘111\n‘, ‘222‘]
with open(‘coop.txt‘) as f: print(f.tell()) # tell()告訴我們光標現在的位置(列的位置) print(f.readline()) # 每次讀一行 print(f.tell()) print(f.readline()) print(f.tell()) print(f.seek(0)) # seek(0)讓光標返回到初始0的位置 print(f.readline()) print(f.readline()) f.seek(5) print(f.readline()) print(f.tell())
0
coopcoopcoopcoopcoopcoopcoopcoop
34
coop
40
0
coopcoopcoopcoopcoopcoopcoopcoop
coop
oopcoopcoopcoopcoopcoopcoop
34
f = open(‘coop.txt‘, ‘a‘)
f.write(‘append\n‘)
# print(f.readlines())
7
with open(‘coop.txt‘,) as f:
data = f.read()
print(data)
coopcoopcoopcoopcoopcoopcoopcoop
coop
coop1
coop2
111
222appendappendappendappendappendappendappend
append
append
append
append
append
##############
# 匹配相應後綴名的文件
import fnmatch
for f in os.listdir(‘.‘):
if fnmatch.fnmatch(f, ‘*.txt‘):
print(f)
elif fnmatch.fnmatch(f, ‘*.pdf)‘):
print(‘find pdf‘, f)
coop-1.txt
coop.txt
# 匹配相應後綴名的文件
import fnmatch
for f in os.listdir(‘.‘):
if fnmatch.fnmatch(f, ‘?+.txt‘): # 正則?,一個字符
print(f)
elif fnmatch.fnmatch(f, ‘?.pdf)‘):
print(‘find pdf‘, f)
#################
import fnmatch
for f in os.listdir(‘.‘):
if fnmatch.fnmatch(f, ‘\w+.txt‘): # 正則?,一個字符
print(f)
elif fnmatch.fnmatch(f, ‘?.pdf)‘):
print(‘find pdf‘, f)
# 單純匹配某種命名規則的文件
import glob
for f in glob.glob(‘[0-9].txt‘):
print(f)
0.txt
1.txt
import glob
for f in glob.glob(‘[0-9]+.txt‘): # 不可以加+號,已匹配更多字符
print(f)
############################
# 序列化 picle ,持久化, 存盤
# 後綴名隨意,推薦使用pkl
# 存儲python的數據結構
name_list = [‘coop‘, ‘fang‘, ‘beijing‘]
data = {‘name‘:name_list, ‘age‘:(2,3,4)}
import pickle
with open(‘data.pkl‘, ‘wb‘) as f: # 使用wb,通用二進制存儲
pickle.dump(data, f)
with open(‘data.pkl‘, ‘rb‘) as f:
data = pickle.load(f)
print(data)
{‘name‘: [‘coop‘, ‘fang‘, ‘beijing‘], ‘age‘: (2, 3, 4)}
############################
# 虛擬文件,臨時文件,不需要真的存到磁盤
import io
output = io.StringIO()
output.write(‘the first code\n‘)
print(‘ddd‘, file=output)
# 去除內容
contents = output.getvalue()
print(contents)
#關閉文件,清理緩存
output.close() # 打印順序為什麽是那個樣子
the first code
ddd
# 用類似字典的方式存儲任意的python對象 pickle存儲的是數據結構
import shelve
with shelve.open(‘coop.she‘) as so:
so[‘coop‘] = ‘fang‘ # 生成三個文件
with shelve.open(‘coop.she‘) as so:
print(so[‘coop‘])
fang
處理任意格式的文本文件