1. 程式人生 > >用Python實現去掉文章中特定的段落

用Python實現去掉文章中特定的段落

有一份試題,每個問題以QUESTION NO開始,然後是該題的答案,以Answer:開始。
為了摘出一份只包含問題,不包含答案的試題,嘗試用ultraedit的正則表示式替換,
但不支援跨行替換。
於是寫了下面的Python程式。
from sys import*
fp=open(argv[1],'r')
fo=open(argv[2],'w')
a=fp.readline()
sym=0
while a!='':
 if a[0:len(argv[3])]==argv[3]:
  sym=1
 if sym==1 and a[0:len(argv[4])]==argv[4]:
  sym=0
 if sym==0 :
  fo.write(a)
 a=fp.readline()
fo.close()
fp.close()
把它命名為gjj.py
然後在windows xp控制檯視窗輸入命令列:
python gjj.py tk007.txt out007.txt "Answer:" "QUESTION NO"
就可以把tk007.txt中的答案部分刪除。