1. 程式人生 > >python解決一些錯誤換行問題

python解決一些錯誤換行問題

有時候會碰到一些錯誤換行的資料,比如正確資料應該是:

20141010,aaa,bbb,ccc,ddd,eee

但是實際給過來的資料是:
20141010,aaa,bbb,
ccc,ddd,
eee

這樣出現錯誤換行,在進行一些資料處理時就不能通過

解決辦法:

import re

dfile=open('tt.txt','r')
lists=[]
for line in dfile:
    m=re.match('2014.+',line)
    if m:
        lists.append(line)
    else:
        lists[-1]=lists[-1].strip('\n')+line

print lists

ofile=open('ttt.txt','w')
for line in lists:
    ofile.write(line)

dfile.close()
ofile.close()

用正則表示式匹配行開頭,去掉換行符