Python 批量讀取檔案中指定字元的實現

阿新 • • 發佈：2020-03-08

1、背景

從指定的NLP生成的檔案中讀取指定的字元。

2、待讀取檔案

是以":"作為分隔符的資料，每一行以回車結束。此檔案為XXX.train

3、讀取每一句中的漢字

...
file_train = os.path.join(rootDir,"data/train/rg_train_"+modle_date+"_"+aiscene+".train") 
with open(file_train,'r')as fp:
	textlist = fp.readlines()
	for text in textlist:
		if ":" in text:
			L4ID = text.split(":")[-2]
			Msg = text.split(":")[-1]
			if query_start == Msg.strip("\n"):
				print("Msg is in train:",Msg)
...

程式碼中先獲取檔案，然後讀取每一行，然後以":"作為分隔符。（-1代表倒數第一個，-2代表倒數第二個）

不管是txt檔案還是xml檔案還是其他的，都可以用這種方法來批量替換檔案中字串：

# -*- coding:utf-8 -*-
__author__ = 'ShawDa'

import glob

xmls = glob.glob('xml_files/*.xml')
for one_xml in xmls:
  print(one_xml)
  f = open(one_xml,'r+',encoding='utf-8')
  all_the_lines = f.readlines()
  f.seek(0)
  f.truncate()
  for line in all_the_lines:
    line = line.replace('dog','pig')
    line = line.replace('cat','bike')
    f.write(line)
  f.close()

到此這篇關於Python 批量讀取檔案中指定字元的實現的文章就介紹到這了,更多相關Python 批量讀取指定字元內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

Python 批量讀取檔案中指定字元的實現

1、背景從指定的NLP生成的檔案中讀取指定的字元。 2、待讀取檔案是以\":\"作為分隔符的資料，每一行以回車結束。此檔案為XXX.train

Java筆記位元組輸入流讀取檔案中的字元

1.構造輸入流，讀取一個位元組 read（）；從輸入流中讀取資料的下一個位元組，返回的是一個int型別的值

python讀取word 中指定位置的表格及表格資料

1.Word文件如下： 2.程式碼 # -*- coding: UTF-8 -*- from docx import Document def readSpecTable(filename,specText):

python批量替換檔名中的共同字元例項

今天看新概念視訊的時候播放器PotPlayer的播放列表總是不能正確排序，我看到這些視訊的名字格式如下：

如何使用pandas讀取txt檔案中指定的列(有無標題)

最近在倒騰一個txt檔案，因為檔案太大，所以給切割成了好幾個小的檔案，只有第一個檔案有標題，從第二個開始就沒有標題了。

使用python批量轉換檔案編碼為UTF-8的實現

由於這兩天換了IDE，在匯入以前的工程的時候發現了一個大問題，由於以前腦殘的我不知道改編碼方式，導致出現了大量的GBK，這就很難受，要是一個兩個還好說，可是這麼多要是一個一個的改我會覺得現在的我比以前還腦殘

C++實現刪除txt檔案中指定內容的示例程式碼

預設明白C++的檔案輸入輸出流方法：新建一箇中間檔案，逐行讀取原檔案(test.txt)的內容並寫入到中間檔案(temp.txt)，遇到需要刪除的內容則跳過。

編碼和解碼.字元流常用方法?字元流注意事項?字元輸入流讀取資料注意事項?字元緩衝流特有方法?什麼是轉換流?如何在讀取檔案時候指定字符集?物件操作流注意事項?Properties集合特有方法

　　　　　　　　　　　　　　　　　　　　　　　　重難點梳理　　　　　　　　　　　　　　　　　　　　　　　　知識點梳理

python查詢字串中指定字元的索引

技術標籤：資料集處理Python python查詢字串中指定字元的索引當你想查詢一個字串中指定字元的位置時，很容易就想到用index方法，但如果字串有多個該字元，你會發現只能查到第一次出現的位置，而python是沒有內建

【請教】商品列表儲存在json檔案中，如何在python中讀取檔案中並儲存到字典中

需求：商品列表儲存到檔案中，通過指令碼讀取修改。 **多謝各位支援** 商品清單｛test1.json｝：

python讀取檔案中的資料插入到mysql

1、python讀取檔案中的資料插入到mysql https://blog.csdn.net/weixin_46429290/article/details/119303393?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_title~default-0-119303393-blog-7

python批量處理檔案或資料夾

本文例項為大家分享了python批量處理檔案或資料夾的具體程式碼，供大家參考，具體內容如下

python:批量統計xml中各類目標的數量案例

之前寫了一個matlab的，越用越覺得麻煩，如果不同資料集要改類別數目，而且執行速度慢。所以重新寫了一個Python的，直接讀取xml資料夾路徑就可以，不用預先知道類別，直接能夠檢測出所有類別的目標名稱及其對應的數量

解決python pandas讀取excel中多個不同sheet表格存在的問題

摘要：不同方法讀取excel中的多個不同sheet表格效能比較 # 方法1 def read_excel(path):

Python批量刪除mysql中千萬級大量資料的指令碼分享

場景描述線上mysql資料庫裡面有張表儲存有每天的統計結果，每天有1千多萬條，這是我們意想不到的，統計結果咋有這麼多。運維找過來，磁碟佔了200G，最後問了運營，可以只保留最近3天的，前面的資料，只能刪了。刪，

python批量刪除檔案，多執行緒版【五】

import os from queue import Queue import threading import datetime def read_directory(directory_name): wenjian=[]

將二維陣列轉換成稀疏陣列，並寫入到檔案中，讀取檔案中的稀疏陣列，將其恢復到原始的二維陣列

技術標籤：資料結構java資料結構矩陣稀疏陣列例如二維陣列中有很多0或者同一值，如果將這些資料元素全部記錄儲存的話，會浪費儲存空間，因為記錄了許多無意義的值。所以需要利用稀疏陣列對二維陣列進行壓縮。

用python獲取txt檔案中關鍵字的數量

緣起：　　開發人員需要tomcat中一個專案在一個月的訪問請求量，因其他原因只剩下查詢tomcat請求日誌的方法獲取，剛好最近在學習python，於是就用python摸索了下；

Python向json檔案中追加內容

技術標籤：Pythonpythonjson追加檔案內容效果原json串：追加後：方法 pos = {"x":posx,"y":posy,"lat":lat,"lng":lng}

python如何讀取列表中元素的位置？

技術標籤：列表字串pythonjava資料結構 python讀取列表中元素位置的方法： 1、使用index()方法獲取列表中指定元素的位置

Python 批量讀取檔案中指定字元的實現

相關推薦