1. 程式人生 > >油管視頻目錄正則整理

油管視頻目錄正則整理

Office辦公 其他

正在學習Qt,從油管的playlist?list=PLPeSWEML8bFV8lzTJ_oORLUlfugzuQ5yF下載了17個視頻,還有配套的文字資料(http://tutorialcoding.com/qt/index.html),非常適合入門!

需要將視頻目錄內容整理一下。

視頻列表文件內容

觀察每條內容的格式

1


6:31
Qt Tutorial, Introduction
Progenitor Softworks
2


10:34
Qt Tutorial: Unit 1, Hello World!
Progenitor Softworks
3


6:15
Qt Tutorial: Unit 2, PushMe!

Progenitor Softworks

序號

空行

視頻時長

視頻文件名

出品人

希望最終獲取的內容格式是:

序號??? 視頻文件名?? 視頻時長


使用NotePad++ 正則:

技術分享圖片

解釋:

查找目標:^([\d]{1,2})(\r\n\r\n)(\d{1,2}:\d{1,2})(\r\n)(.*)(\r\n)(.*)$

^代表行開始,後接7組內容(1)(2)(3)(4)(5)(6)(7),每組要查找的內容都以(、)包含。

其中(2)、(4)、(6)組內容為(\r\n\r\n)、(\r\n),意為查找回車(\r)換行(\n)。

(1)組內容為([\d]{1,2}),意為匹配最多兩位數字(.*),且(1)組後接兩個回車換行符號(2)。

(3)組內容為(\d{1,2}:\d{1,2}),意為匹配mm:ss的時間格式,(3)組後接1個回車換行符(4)。

(5)組內容為(.*),意為任意長度的字符,匹配視頻文件名(包含空格),(5)組後接1個回車換行符(6)。

(7)組內容為(.*),意為任意長度的字符,匹配Progenitor Softworks,(7)組後接$,代表行結束,實際就是行尾的回車換行符。

替換為:$1\t$5\t$3

保留匹配內容的3組內容:(1)序號、(5)視頻文件名、(3)視頻時長,並按指定順序顯示,而且內容之間使用tab(\t)分隔。


前後結果如下(左側是原始內容,右側是處理過後內容):

技術分享圖片

油管視頻目錄正則整理