notepad++正則匹配及匹配內容的保留與處理
很多時候,我們需要對一些大文字進行處理,比如查詢、替換等等。然而,在更多時候,對於我們要替換的物件只有若干印象描述,比如知道它前面是什麼鬼,後面是什麼鬼,或者自己是由某些字母組成,不能精確地把它拼寫出來,這時,就要用到正則表示式。
我們看保研論壇夏令營2016理科彙總貼,連結。
我們想找到所有數學專業同學能報的夏令營,藉助網站自帶的find功能,略顯分散,每一都要一個一個看,不利於儲存之餘,手機上也不能看。
這時,我想用txt將所有數學專業同學能報的夏令營包括它的連結儲存下來。不用python,這次改用notepad++的錄製巨集功能。
- 右鍵點選,網頁另存為。
- 用natepad++開啟儲存下來的網頁。我們看看這個凌亂的原始碼。
- ctrl+F開啟搜尋介面。選擇“標記”標籤頁。打勾“正則表示式“、”標記所在行“、“清除上次標記”。
查詢全部
^.*?([0-9]+\.).*?href="(.*?)".*?>(.*?數.*?)<.*?$
搜尋-書籤-刪除未標記行。
- 替換以上目標為
\1\3\n\2\n\n\n
<.*?>
替換為空白,大功告成。
我們可以錄製成巨集,以便下次內容更新後,點選直接生成;儲存後用記事本開啟有可能空格和換行沒了,只要在notepad++中雙擊修改狀態列中的某一項就行了,比如說unix轉換為windows格式。