vim中使用正則表達式

阿新 • • 發佈：2017-06-08

.html 函數表達式定向源文件替換字符標準一覽 ati adc

一、使用正則表達式的命令

使用正則表達式的命令最常見的就是 / （搜索）命令。

其格式例如以下：

/正則表達式

還有一個非常實用的命令就是 :s（替換）命令，將第一個//之間的正則表達式替換成第二個//之間的字符串。

:s/正則表達式/替換字符串/選項

在學習正則表達式時能夠利用 / 命令來練習。

二、元字符

元字符是具有特殊意義的字符。使用元字符能夠表達隨意字符、行首、行尾、某幾個字符等意義。

元字符一覽

元字符	說明
.	匹配隨意一個字符
[abc]	匹配方括號裏的隨意一個字符。能夠使用-表示字符範圍，如[a-z0-9] 匹配小寫字母和阿拉伯數字。
[^abc]	在方括號內開頭使用^符號，表示匹配除方括號裏字符之外的隨意字符。
\d	匹配阿拉伯數字，等同於[0-9]。
\D	匹配阿拉伯數字之外的隨意字符。等同於[^0-9]。
\x	匹配十六進制數字，等同於[0-9A-Fa-f]。
\X	匹配十六進制數字之外的隨意字符，等同於[^0-9A-Fa-f]。
\w	匹配單詞字母，等同於[0-9A-Za-z_]。
\W	匹配單詞字母之外的隨意字符，等同於[^0-9A-Za-z_]。
\t	匹配<TAB>字符。
\s	匹配空白字符，等同於[ \t]。
\S	匹配非空白字符。等同於[^ \t]。

另外。假設要查找字符 *、.、/等。則須要在前面用 \ 符號。表示這不是元字符，而僅僅是普通字符而已。

元字符	說明
\*	匹配 * 字符。
\.	匹配 . 字符。
\/	匹配 / 字符。
\\	匹配 \ 字符。
\[	匹配 [ 字符。

表示數量的元字符

元字符	說明
*	匹配0-隨意個
\+	匹配1-隨意個
\?	匹配0-1個
\{n,m}	匹配n-m個
\{n}	匹配n個
\{n,}	匹配n-隨意個
\{,m}	匹配0-m個

表示位置的符號

元字符	說明
$	匹配行尾
^	匹配行首
\<	匹配單詞詞首
\>	匹配單詞詞尾

使用例

/char\s\+[A-Za-z_]\w*;                 " 查找全部以char開頭。之後是一個以上的空白。
                                             " 最後是一個標識符和分號
/\d\d:\d\d:\d\d                        " 查找如 17:37:01 格式的時間字符串
:g/^\s*$/d                             " 刪除僅僅有空白的行
:s/\<four\>/4/g                        " 將全部的four替換成4。可是fourteen中的four不替換

三、替換變量

在正規表達式中使用 $ 和 $ 符號括起正規表達式，就可以在後面使用\1、\2 等變量來訪問 $ 和 $ 中的內容。

使用例

/\(a\+\)[^a]\+\1                                          " 查找開頭和結尾處a的個數同樣的字符串，
                                                                  " 如 aabbbaa，aaacccaaa，可是不匹配 abbbaa
:s/\(http:\/\/[-a-z\._~\+%\/]\+\)/<a href="\1">\1<\/a>/   " 將URL替換為<a href="http://url">http://url</a>的格式
:s/\(\w\+\)\s\+\(\w\+\)/\2\t\1                            " 將 data1 data2 改動為 data2 data1

四、函數式

在替換命令 s/// 中能夠使用函數表達式來書寫替換內容，格式為

:s/替換字符串/\=函數式

在函數式中能夠使用 submatch(1)、submatch(2) 等來引用 \1、\2 等的內容。而submatch(0)能夠引用匹配的整個內容。

使用例

:%s/\<id\>/\=line(".")                              " 將各行的 id 字符串替換為行號
:%s/^\<\w\+\>/\=(line(".")-10) .".". submatch(1)    " 將每行開頭的單詞替換為 (行號-10).單詞 的格式。
                                                           " 如第11行的 word 替換成 1. word

五、與Perl正則表達式的差別

元字符的差別

Vim語法	Perl語法	含義
\+	+	1-隨意個
\?	?	0-1個
\{n,m}	{n,m}	n-m個
$和$	(和)	分組

六、vi 正則表達式練習

閑言碎語不要講…樣例說明一切。比方以下這段我須要換成 ubb 標簽

vim 命令模式。輸入

:%s/.*src=”([^"]*)”[^>]*>/[img]1[/img]/g

替換為

[img ]gu.jpg[ /img]

[img ]os.jpg[ /img]

[img ]hu.jpg[ /img]

[img ]ang.jpg[ /img]

解釋例如以下：

命令運行狀態

表示查找並替換

%s/a/b/g

a 被查找的字符串（正則匹配）。b 要替換成的文字。g 表示全局搜索替換（否則僅僅處理找到的第一個結果）

([^"]*)

表示非引號的字符N個。外面 () 表示後面替換要用（用 1,…,9等引用）

[/img]

/ 須要被轉義

與其他工具正則不一樣的地方在於 () 也必須 ()，怪不得我老是弄不出來。

相關資料：

via http://net.pku.edu.cn/~yhf/tao_regexps_zh.html

vi 命令作用

:%s/ */ /g 把一個或者多個空格替換為一個空格。

:%s/ *$// 去掉行尾的全部空格。

:%s/^/ / 在每一行頭上增加一個空格。

:%s/^[0-9][0-9]* // 去掉行首的全部數字字符。

:%s/b[aeio]g/bug/g 將全部的bag、beg、big和bog改為bug。

:%s/t([aou])g/h1t/g 將全部tag、tog和tug分別改為hat、hot和hug（註意用group的使用方法和使用1引用前面被匹配的字符）。

Sed

Sed是Stream EDitor的縮寫，是Unix下經常使用的基於文件和管道的編輯工具。能夠在手冊中得到關於sed的具體信息。

這裏是一些有趣的sed腳本，假定我們正在處理一個叫做price.txt的文件。註意這些編輯並不會改變源文件。sed僅僅是處理源文件的每一行並把結果顯示在標準輸出中（當然非常easy使用重定向來定制）：

sed腳本描寫敘述

sed ’s/^$/d’ price.txt 刪除全部空行

sed ’s/^[ ]*$/d’ price.txt 刪除全部僅僅包括空格或者制表符的行

sed ’s/”//g’ price.txt 刪除全部引號

關於magic

vim中有個magic的設定。

設定方法為：

:set magic             " 設置magic
:set nomagic           " 取消magic
:h magic               " 查看幫助

vim畢竟是個編輯器，正則表達式中包括的大量元字符假設原封不動地引用（像perl那樣），
勢必會給不懂正則表達式的人造成麻煩。比方 /foo(1) 命令。大多數人都用它來查找foo(1)這個字符串，但假設依照正則表達式來解釋，被查找的對象就成了 foo1 了。

於是，vim就規定，正則表達式的元字符必須用反斜杠進行轉義才行，如上面的樣例。假設確實要用正則表達式，就應當寫成 /foo(1) 。可是。像 . * 這樣的極其經常使用的元字符，都加上反斜杠就太麻煩了。

並且，眾口難調，有些人喜歡用正則表達式。有些人不喜歡用……

為了解決問題，vim設置了 magic 這個東西。

簡單地說。 magic就是設置哪些元字符要加反斜杠哪些不用加的。
簡單來說：

magic(\m)：除了 $ . * ^ 之外其它元字符都要加反斜杠。
nomagic(\M)：除了 $ ^ 之外其它元字符都要加反斜杠。

這個設置也能夠在正則表達式中通過 \m \M 開關暫時切換。 \m 後面的正則表達式會依照 magic 處理，\M 後面的正則表達式依照 nomagic 處理，而忽略實際的magic設置。

比如：

/\m.*          # 查找隨意字符串
/\M.*          # 查找字符串 .* （點號後面跟個星號）

另外還有更強大的 \v 和 \V。 * \v（即 very magic 之意）：不論什麽元字符都不用加反斜杠 * \V（即 very nomagic 之意）：不論什麽元字符都必須加反斜杠

比如：

/\v(a.c){3}$   # 查找行尾的abcaccadc
/\m(a.c){3}$   # 查找行尾的(abc){3}
/\M(a.c){3}$   # 查找行尾的(a.c){3}
/\V(a.c){3}$   # 查找任何位置的(a.c){3}$

默認設置是 magic，vim也推薦大家都使用magic的設置，在有特殊須要時，直接通過 \v\m\M\V 就可以。

本文以下使用的元字符都是 magic 模式下的。

量詞

vim的量詞與perl相比一點也不遜色。

vim	Perl	意義
*	*	0個或多個(匹配優先)
\+	+	1個或多個(匹配優先)
\? 或 \=	?	0個或1個(匹配優先)，\? 不能在 ? 命令（逆向查找）中使用
\{n,m}	{n,m}	n個到m個(匹配優先)
\{n,}	{n,}	最少n個(匹配優先)
\{,m}	{,m}	最多m個(匹配優先)
\{n}	{n}	恰好n個
\{-n,m}	{n,m}?	n個到m個(忽略優先)
\{-}	*?	0個或多個(忽略優先)
\{-1,}	+?	1個或多個(忽略優先)
\{-,1}	??	0個或1個(忽略優先)

從上表中可見，vim的忽略優先量詞不像perl的 *?

+? ?? 那樣。而是統一使用 {- 實現的。

這大概跟忽略優先量詞不經常使用有關吧。

環視和固化分組

vim竟然還支持環視和固化分組的功能，強大。贊一個 :D
關於環視的解釋請參考Yurii的《精通正則表達式》一書吧。

vim	Perl	意義
\@=	(?=	順序環視
\@!	(? !	順序否定環視
\@<=	(?<=	逆序環視
\@	(?	逆序否定環視
\@>	(?>	固化分組
\%(atom\)	(? :	非捕獲型括號

和perl稍有不同的是。vim中的環視和固化分組的模式的位置與perl不同。比如，查找緊跟在 foo 之後的 bar，perl將模式寫在環視的括號內，而vim將模式寫在環視的元字符之前。

# Perl的寫法
/(?<=foo)bar/

# vim的寫法
/\(foo\)\@<=bar

參考

vim的幫助文件很實用，關於正則表達式能夠參考下面的內容。

:h pattern
:h magic
:h perl-patterns

vim中使用正則表達式

vim中使用正則表達式

一、使用正則表達式的命令

二、元字符

表示數量的元字符

表示位置的符號

三、替換變量

四、函數式

五、與Perl正則表達式的差別

六、vi 正則表達式練習

關於magic

量詞

環視和固化分組

參考

Python中正則表達式（re模塊）的使用

Jmeter中正則表達式提取器使用詳解

1000行代碼徒手寫正則表達式引擎【1】--JAVA中正則表達式的使用

【RegExp】JavaScript中正則表達式判斷匹配規則以及常用方法

JAVA中正則表達式學習總結

rename命令中正則表達式的使用

java中正則表達式基本用法（轉）

python 中正則表達式的使用

java中正則表達式要進行轉義的字符。

Go語言中正則表達式的使用

jquery中正則表達式運用樣例

Linux中正則表達式的練習集合

初識VIM和正則表達式

python中正則表達式的一些問題

UE中正則表達式

JS中正則表達式

文本處理（grep,vim)，正則表達式

pandas和re中正則表達式的意思

python中正則表達式與模式匹配

vim中使用正則表達式

vim中使用正則表達式

一、使用正則表達式的命令

二、元字符

表示數量的元字符

表示位置的符號

三、替換變量

四、函數式

五、與Perl正則表達式的差別

六、vi 正則表達式練習

關於magic

量詞

環視和固化分組

參考

相關推薦