nginx 正則表示式匹配入門篇

阿新 • • 發佈：2019-01-20

1、nginx配置基礎

1、正則表示式匹配

~ 區分大小寫匹配

~* 不區分大小寫匹配

!~和!~*分別為區分大小寫不匹配及不區分大小寫不匹配

^ 以什麼開頭的匹配

$ 以什麼結尾的匹配

轉義字元。可以轉. * ?等

* 代表任意字元

2、檔案及目錄匹配

-f和!-f用來判斷是否存在檔案

-d和!-d用來判斷是否存在目錄

-e和!-e用來判斷是否存在檔案或目錄

-x和!-x用來判斷檔案是否可執行

例:

location = /

#匹配任何查詢，因為所有請求都已 / 開頭。但是正則表示式規則和長的塊規則將被優先和查詢匹配

location ^~ /images/ {

# 匹配任何已/images/開頭的任何查詢並且停止搜尋。任何正則表示式將不會被測試。

location ~* .(gif|jpg|jpeg)$ {

# 匹配任何已.gif、.jpg 或 .jpeg 結尾的請求

入門

1、if指令
所有的Nginx內建變數都可以通過if指令和正則表示式來進行匹配，並且根據匹配結果進行一些操作，如下：

程式碼如下	複製程式碼
if ($http_user_agent ~ MSIE) { rewrite ^(.)$ /msie/$1 break; } if ($http_cookie ~ "id=([^;] +)(?:;\|$)" ) { set $id $1; }

使用符號~*和~模式匹配的正則表示式：

1.~為區分大小寫的匹配。
2.~*不區分大小寫的匹配（匹配firefox的正則同時匹配FireFox）。
3.!~和!~*意為“不匹配的”。
Nginx在很多模組中都有內建的變數，常用的內建變數在HTTP核心模組中，這些變數都可以使用正則表示式進行匹配。

2、可以通過正則表示式匹配的指令
location
檢視維基：location
可能這個指令是我們平時使用正則匹配用的最多的指令：

程式碼如下	複製程式碼
location ~ .*.php?$ { fastcgi_pass 127.0.0.1:9000; fastcgi_index index.php; fastcgi_param SCRIPT_FILENAME /data/wwwsite/test.com/$fastcgi_script_name; include fcgi.conf; }

幾乎每個基於LEMP的主機都會有如上一段程式碼。他的匹配規則類似於if指令，不過他多了三個識別符號，^~、=、@。並

且它沒有取反運算子!，這三個識別符號的作用分別是：

1.^~ 識別符號後面跟一個字串。Nginx將在這個字串匹配後停止進行正則表示式的匹配（location指令中正則表達

式的匹配的結果優先使用），如：location ^~ /images/，你希望對/images/這個目錄進行一些特別的操作，如增加

expires頭，防盜鏈等，但是你又想把除了這個目錄的圖片外的所有圖片只進行增加expires頭的操作，這個操作可能

會用到另外一個location，例如：location ~* .(gif|jpg|jpeg)$，這樣，如果有請求/images/1.jpg，nginx如何決

定去進行哪個location中的操作呢？結果取決於識別符號^~，如果你這樣寫：location /images/，這樣nginx會將1.jpg

匹配到location ~* .(gif|jpg|jpeg)$這個location中，這並不是你需要的結果，而增加了^~這個識別符號後，它在匹

配了/images/這個字串後就停止搜尋其它帶正則的location。
2.= 表示精確的查詢地址，如location = /它只會匹配uri為/的請求，如果請求為/index.html，將查詢另外的

location，而不會匹配這個，當然可以寫兩個location，location = /和location /，這樣/index.html將匹配到後者

，如果你的站點對/的請求量較大，可以使用這個方法來加快請求的響應速度。
[email protected] 表示為一個location進行命名，即自定義一個location，這個location不能被外界所訪問，只能用於Nginx產生的

子請求，主要為error_page和try_files。
注意，這3個識別符號後面不能跟正則表示式，雖然配置檔案檢查會通過，而且沒有任何警告，但是他們並不會進行匹配

。
綜上所述，location指令對於後面值的匹配順序為：

1.識別符號“=”的location會最先進行匹配，如果請求uri匹配這個location，將對請求使用這個location的配置。
2.進行字串匹配，如果匹配到的location有^~這個識別符號，匹配停止返回這個location的配置。
3.按照配置檔案中定義的順序進行正則表示式匹配。最早匹配的location將返回裡面的配置。
4.如果正則表示式能夠匹配到請求的uri，將使用這個正則對應的location，如果沒有，則使用第二條匹配的結果。
server_name
檢視維基：server_name
server_name用於配置基於域名或IP的虛擬主機，這個指令也是可以使用正則表示式的，但是注意，這個指令中的正則

表示式不用帶任何的識別符號，但是必須以~開頭：

程式碼如下	複製程式碼
server { server_name www.example.com ~^wwwd+.example.com$; }

server_name指令中的正則表示式可以使用引用，高階的應用可以檢視這篇文章：在server_name中使用正則表示式

fastcgi_split_path_info
檢視維基：fastcgi_split_path_info
這個指令按照CGI標準來設定SCRIPT_FILENAME (SCRIPT_NAME)和PATH_INFO變數，它是一個被分割成兩部分（兩個引用

）的正則表示式。如下：

程式碼如下	複製程式碼
location ~ ^.+.php { (...) fastcgi_split_path_info ^(.+.php)(.*)$; fastcgi_param SCRIPT_FILENAME /path/to/php$fastcgi_script_name; fastcgi_param PATH_INFO $fastcgi_path_info; fastcgi_param PATH_TRANSLATED $document_root$fastcgi_path_info; (...) }

第一個引用（.+.php）加上/path/to/php將作為SCRIPT_FILENAME，第二個引用(.*)為PATH_INFO，例如請求的完整

URI為show.php/article/0001，則上例中SCRIPT_FILENAME的值為/path/to/php/show.php，PATH_INFO則

為/article/0001。
這個指令通常用於一些通過PATH_INFO美化URI的框架（例如CodeIgniter）。

gzip_disable
檢視維基：gzip_disable
通過正則表示式來指定在哪些瀏覽器中禁用gzip壓縮。

gzip_disable "msie6";rewrite
檢視維基：rewrite
這個指令應該也是用的比較多的，它需要使用完整的包含引用的正則表示式：

程式碼如下	複製程式碼
rewrite "/photos/([0-9] {2})([0-9] {2})([0-9] {2})" /path/to/photos/$1/$1$2/$1$2$3.png;通常環境下我們

會把它和if結合來使用：

程式碼如下	複製程式碼
if ($host ~* www.(.)) { set $host_without_www $1; rewrite ^(.)$ http://$host_without_www$1 permanent; # $1為'/foo'，而不是'www.mydomain.com/foo' }

Nginx中的正則如何匹配中文
首先確定在編譯pcre時加了enable-utf8引數，如果沒有，請重新編譯pcre，然後就可以在Nginx的配置檔案中使用這

樣的正則：”(*UTF8)^/[x{4e00}-x{9fbf}]+)$”注意引號和前面的(*UTF8)，(*UTF8)將告訴這個正則切換為UTF8模

式。

程式碼如下

複製程式碼

[[email protected] conf]# pcretest
PCRE version 8.10 2010-06-25

re> /^[x{4e00}-x{9fbf}]+/8
data> 測試
0: x{6d4b}x{8bd5}
data> Nginx模組參考手冊中文版
No match
data> 參考手冊中文版
0: x{53c2}x{8003}x{624b}x{518c}x{4e2d}x{6587}x{7248}

location順序錯誤導致下載.php原始碼而不執行php程式的問題

看下面的例子片斷(server段、wordpress安裝到多個目錄)：
=====================================

程式碼如下

複製程式碼

location / {
try_files $uri $uri/ /index.html;
}

location /user1/ {
try_files $uri $uri/ /user1/index.php?q=$uri&$args;
}

location ~* ^/(user2|user3)/ {
try_files $uri $uri/ /$1/index.php?q=$uri&$args;
}

location ~ .php$ {
        fastcgi_pass 127.0.0.1:9000;
        fastcgi_index index.php;
        include fastcgi_params;
}

=====================================

nginx.conf的配置程式碼看上去沒有任何問題，而事實上：
訪問 /user1/會正常執行php程式。
訪問 /user2/ 或 /user3/ 都不會執行程式，而是直接下載程式的原始碼。

原因在哪裡？看到他們地區別了嗎？
/user1/是普通location寫法
而/user2/ 或 /user3/ 是正則表示式匹配的location

問題就出在了/user2/ 或 /user3/匹配location指令使用了正則表示式，所以必須注意程式碼段的先後順序，必須把

location ~ .php$ {...}段上移、放到它的前面去。

正確的程式碼舉例：
=====================================

程式碼如下

複製程式碼

location / {
try_files $uri $uri/ /index.html;
}

location /user1/ {
try_files $uri $uri/ /user1/index.php?q=$uri&$args;
}

location ~ .php$ {
        fastcgi_pass 127.0.0.1:9000;
        fastcgi_index index.php;
        include fastcgi_params;
}

location ~* ^/(user2|user3)/ {
try_files $uri $uri/ /$1/index.php?q=$uri&$args;
}

=====================================

【注意】對於普通location指令行，是沒有任何順序的要求的。如果你也遇到了類似的問題，可以嘗試調整使用正則

表示式的location指令片斷的順序來除錯

nginx 正則表示式匹配入門篇

nginx 正則表示式匹配入門篇

Nginx正則表示式之匹配操作符詳解

Nginx模組開發中使用PCRE正則表示式匹配

python入門—2常見問題_1_正則表示式匹配中文

[Swift]LeetCode10. 正則表示式匹配 | Regular Expression Matching

正則表示式—匹配原則

正則表示式匹配換行符

PHP 正則表示式---匹配模式

C# -- 正則表示式匹配字元之含義

劍指offer——正則表示式匹配（遞迴呼叫）

常用的正則表示式匹配數字

SQL語句正則表示式匹配(獲取) 所有表名

正則表示式匹配最後一部分

正則表示式匹配案例

劍指offer系列——陣列中重複的數字，構建乘積陣列，正則表示式匹配

PHP 正則表示式匹配函式 preg_match 與 preg_match_all

劍指Offer 52. 正則表示式匹配（字串）

leetcode題庫——正則表示式匹配

正則表示式匹配使用者名稱/密碼/Email/身份證

python 正則表示式匹配特定浮點數

nginx 正則表示式匹配入門篇

相關推薦