python查詢字串內的某個字元,進行操作
找出每一行中的某個欄位來進行識別,並在後面新增此標記的內容
# -*- coding: utf-8 -*-
'''
查詢每個字串中是否包含某個字元,在該字串後新增東西
或者使用replace方法進行替換
'''
import re
def fenhang(infile,outfile):
infopen = open(infile,'r',encoding='utf-8')
outopen = open(outfile,'w',encoding='utf-8')
lines = infopen.readlines()
db = []
for line in lines:
db.append(line)
for i in range(0,len(db)):
sett = db[i].strip()
if 'f' in sett:
outopen.write(sett+' B-PER'+'\n')
elif 'z' in sett:
outopen.write(sett+' B-LOC'+'\n')
elif 'a' in sett:
outopen.write(sett+' B-ORG'+'\n' )
else:
outopen.write(sett + ' O'+'\n')
infopen.close()
outopen.close()
fenhang("C:/Users/Administrator/Desktop/new2.txt","C:/Users/Administrator/Desktop/new.en")
相關推薦
python查詢字串內的某個字元,進行操作
找出每一行中的某個欄位來進行識別,並在後面新增此標記的內容 # -*- coding: utf-8 -*- ''' 查詢每個字串中是否包含某個字元,在該字串後新增東西 或者使用replace方法進行
Python去掉字串中的字元,僅保留數字(ValueError: invalid literal for int() with base 10: "b'960")
博主在執行程式的過程中遇到了如上問題,在此記錄下解決方式和產生這個問題的原因。更新於2019.01.05。 解決方式 首先給出解決方式(即去掉字串中的字元,僅保留數字)。找到報錯的那一行中呼叫了int(string)語句的地方,將其改為int(re.sub("\D","",str
python查詢mongodb內數據
%d mongod 運行時間 from 一個 imp item ocl .cn 初學者,寫的不好請指出。 #第一步以insertTime為條件查詢時間段內的數據 #第二部步可以選擇是否再以通話Id為條件篩選第一步所查詢出來的數據 #因為使用的是配置文件,所以首先在代碼當前
python基礎(內存分析,不引入第三方變量的方式交換變量的值)
LV -s img alt 交換變量 指向 .com src ria a,b指向同一塊內存地址 下面方法是重新給b賦值;a,b指向不同的內存地址 字符串或int類型內存分析 不引入第三方變量的方式,交換a,b的值 python基礎(內存分析,不引入第三方變量的方
python關於字串內建方法
1. str.split() Return a list of the words in the string, using sep as the delimiter string. sep The delimiter according which to split the s
python拼接字串的特殊方法,除了常見的+加號和%百分號以外,還可以不用加號直接拼>>> 'a''b' 結果:'ab',以及使用'abc{0}{1}{2}'.format(a, b, c)函式拼接
>>> 'a''b' 'ab' >>> a, b, c = 1, 2, 3 >>> 'abc{0}{1}{2}'.format(a, b, c) 'abc123' Python字串拼接詳解 Pyth
用字串常量對字元陣列進行初始化
有幾種錯誤的初始化方法要注意: char str[3] = {"abc", " ", " "}; error : excess elements in char array initializer char str[3] = "abc"; char str[3] = {"a
查詢字串中指定字元
1.查詢字串中指定字元 String qqBrowser = "Mozilla/5.0 (Windows NT 6.1; WOW64; Trident/7.0; rv:11.0; QQBrowser/7.7.28658.400) like Gecko";//字串 String regStr
dict.get()方法的應用:計算字串內各個字元出現次數的實現方法
實現(implementation)是進行某種計算的一個具體方式 實現程式碼1: def histogram(s): d = dict() # 先定義一個字典d, 效果等同於d = {} for c in s: # loop整個字串裡的字元
查詢字串中指定字元的第一個下標_程式碼的優雅寫法
刷 leetCode 有一個題目需要實現 String.indexOf() 的原始碼,好奇之下在 Intellij IDEA 中查看了它的源代,意外地發現原始碼中關於在字串中查詢指定字元的下標的優雅程式碼(至少比我寫的優雅),於是乎我打算開個貼記錄一下。 S
SQL Server 查詢字串中指定字元的個數
需求:查詢數字1在欄位Data中出現的次數。(表如上圖所示) 要查詢某個指定的字元在字串中出現的位置,方法比較簡單,使用 len() 函式和 replace() 函式結合就可以。 實現方法舉例: 假定@str就是表中的Data欄位 DECLARE @str VAR
C#呼叫命令列執行python指令碼,這個辦法可以呼叫python第三方模組和對本地檔案進行操作
string pythonScriptPath = Server.MapPath(@"~\pythonScript");//python指令碼所在的目錄 ProcessStartInfo start = new Pro
python統計字串中每個字元出現的次數
1、獲取字串 2、去除字串中的特殊符號 3、轉化為列表 4、插入到字典 程式碼如下 str = 'you can hear the whistle blow a hundred miles' str = str.replace(" ","") #去除空格 str_list1 =
字串內特殊字元處理‘#’‘@’
//問題描述 /* 輸入一個字串,裡面包含特殊字元‘@’‘#’,對每個字串作如下處理 1. 如果遇到‘@’,則刪除‘@’之前的所有字元(包括‘@’) 2. 如果遇到‘#’,則刪除‘#’之前的一個字元(
python去掉字串中的字母,只保留數字
>>> import os,sys,string >>> s = "NaN9771Abc742055" >>> s = filter(lambda ch: ch in '0123456789', s) >>&
python 替換字串中的字元
import os import re ls = [] lr = [] r = re.compile(r'\jackliu\\') # path = r"C:\Users\jackliu\Deskt
Python判斷字串、檔案字元編碼
本段工具程式碼用於判斷字串或者文字檔案的字元編碼型別,可以識別常用的UTF-8,UTF-8-SIG,UTF-16,GBK,GB2312 ,GB18030 ,ASCII字元編碼格式,如果有特殊字符集需求,可以擴充字元編碼列表。 程式碼如下: [charse
layui:根據行內某個值,設定該行得背景色
1 done:function () { 2 $("table tr").each(function () { 3 var s = $(this).children().eq(1).text(); 4
【C++】如何統計一個字串中某個字元出現的個數?將C-風格字串作為引數的函式
目錄 預備的基礎知識 將C-風格字串作為引數的函式 C-風格字串與常規char陣列之間的區別 統計某個字串中含有字元個數的程式 預備的基礎知識 C-風格字串由一系列字元組成,以空值字元結尾('\0') 將
彙編複習(在字串搜尋特定字元,成功顯示其位置,否則顯示"not found")
data segment str1 db "loveYHigh" len_str1 equ $-str1 s_fail db "not found$" s_element db "Y" data ends code segment assume cs