1. 程式人生 > 程式設計 >Python 批量讀取檔案中指定字元的實現

Python 批量讀取檔案中指定字元的實現

1、背景

從指定的NLP生成的檔案中讀取指定的字元。

2、待讀取檔案

Python 批量讀取檔案中指定字元的實現

是以":"作為分隔符的資料,每一行以回車結束。此檔案為XXX.train

3、讀取每一句中的漢字

...
file_train = os.path.join(rootDir,"data/train/rg_train_"+modle_date+"_"+aiscene+".train") 
with open(file_train,'r')as fp:
	textlist = fp.readlines()
	for text in textlist:
		if ":" in text:
			L4ID = text.split(":")[-2]
			Msg = text.split(":")[-1]
			if query_start == Msg.strip("\n"):
				print("Msg is in train:",Msg)
...

程式碼中先獲取檔案,然後讀取每一行,然後以":"作為分隔符。(-1代表倒數第一個,-2代表倒數第二個)

不管是txt檔案還是xml檔案還是其他的,都可以用這種方法來批量替換檔案中字串:

# -*- coding:utf-8 -*-
__author__ = 'ShawDa'

import glob

xmls = glob.glob('xml_files/*.xml')
for one_xml in xmls:
  print(one_xml)
  f = open(one_xml,'r+',encoding='utf-8')
  all_the_lines = f.readlines()
  f.seek(0)
  f.truncate()
  for line in all_the_lines:
    line = line.replace('dog','pig')
    line = line.replace('cat','bike')
    f.write(line)
  f.close()

到此這篇關於Python 批量讀取檔案中指定字元的實現的文章就介紹到這了,更多相關Python 批量讀取指定字元內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們!