油管視頻目錄正則整理
需要將視頻目錄內容整理一下。
視頻列表文件內容
觀察每條內容的格式
1
6:31
Qt Tutorial, Introduction
Progenitor Softworks
2
10:34
Qt Tutorial: Unit 1, Hello World!
Progenitor Softworks
3
6:15
Qt Tutorial: Unit 2, PushMe!
序號
空行
視頻時長
視頻文件名
出品人
希望最終獲取的內容格式是:
序號??? 視頻文件名?? 視頻時長
使用NotePad++ 正則:
解釋:
查找目標:^([\d]{1,2})(\r\n\r\n)(\d{1,2}:\d{1,2})(\r\n)(.*)(\r\n)(.*)$
^代表行開始,後接7組內容(1)(2)(3)(4)(5)(6)(7),每組要查找的內容都以(、)包含。
其中(2)、(4)、(6)組內容為(\r\n\r\n)、(\r\n),意為查找回車(\r)換行(\n)。
(1)組內容為([\d]{1,2}),意為匹配最多兩位數字(.*),且(1)組後接兩個回車換行符號(2)。
(3)組內容為(\d{1,2}:\d{1,2}),意為匹配mm:ss的時間格式,(3)組後接1個回車換行符(4)。
(5)組內容為(.*),意為任意長度的字符,匹配視頻文件名(包含空格),(5)組後接1個回車換行符(6)。
(7)組內容為(.*),意為任意長度的字符,匹配Progenitor Softworks,(7)組後接$,代表行結束,實際就是行尾的回車換行符。
替換為:$1\t$5\t$3
保留匹配內容的3組內容:(1)序號、(5)視頻文件名、(3)視頻時長,並按指定順序顯示,而且內容之間使用tab(\t)分隔。
前後結果如下(左側是原始內容,右側是處理過後內容):
油管視頻目錄正則整理