Lua中正則表示式的使用整理

阿新 • • 發佈：2018-12-19

在Lua中使用正則表示式進行模式匹配的string庫函式有這四個：

string.find(str, pattern[, init[, plain]])

string.gsub(str, pattern, repl[, n])

string.match(str, pattern[, init])

string.gmatch(str, pattern)

在Lua中進行模式匹配的時候支援的字元類如下：

Lua正則表示式
元字元	描述	備註
%a	匹配字母，無論大小寫
%b	匹配對稱字元，一般寫法為"%bxy"，x為開始匹配字元，y為結束匹配字元，xy可隨意指定	例如："%b<>"為匹配包括<>在內的所有字元
%c	匹配控制字元	例如：換行符\n、製表符\t等
%d	匹配數字0-9
%l	匹配小寫字母a-z
%p	匹配標點符號
%s	匹配空白符號
%u	匹配大寫字母A-Z
%w	匹配字母和數字
%x	匹配十六進位制數字
%z	匹配代表0的字元
以上字元類除了%b以外的大寫形式表示取反，也就是取小寫形式匹配集合的補集		例如："%A"為匹配除字母外的其他字元，"%D"為匹配除數字外的其他字元
.	匹配任意字元
%	特殊字元的轉義字元	例如："%."為匹配點號，"%%"為匹配百分比符號，跟"\""用來轉義引號類似
()	匹配與返回括號內的內容
[]	自定義匹配字符集	例如："[a-z0-9,%]"匹配a-z、0-9、逗號以及百分比號
+	匹配前一字元1次或多次
*	匹配前一字元0次或多次	最長匹配
-	匹配前一字元0次或多次	最短匹配
?	匹配前一字元0次或1次
^	匹配字串開頭	例如："^%d+"為以數字開頭的匹配
$	匹配字串結尾	例如："%d+$"為以數字結尾的匹配

普通元字元的例子：

-- %a
local str = "ab12"
print(string.gsub(str, "%a", "C"))  -- CC12 2
print(string.gsub(str, "%A", "C"))  -- abCC 2

-- %b
str = "12a<nice>bc"
print(string.match(str, "%b<>"))  -- <nice>

-- %c
str = "s12\naaa\tbb"
print(string.gsub(str, "%c", "Y"))  -- s12YaaaYbb   2
print(string.gsub(str, "%C", "Y"))
-- YYY
-- YYY YY  8

-- %d
str = "ab1c2d"
print(string.gsub(str, "%d", "6"))  -- ab6c6d   2
print(string.gsub(str, "%D", "6"))  -- 661626   4

-- %l
str = "AbA12Bc3"
print(string.gsub(str, "%l", "G"))  -- AGA12BG3 2
print(string.gsub(str, "%L", "G"))  -- GbGGGGcG 6

-- %p
str = "hello world!"
print(string.match(str, "%p"))  -- !
print(string.match(str, "%P"))  -- h

-- %s
str = "hello world!"
print(string.gsub(str, "%s", ","))  -- hello,world! 1
print(string.gsub(str, "%S", ","))  -- ,,,,, ,,,,,, 11

-- %u
str = "AbA12Bc3"
print(string.gsub(str, "%u", "U"))  -- UbU12Uc3 3
print(string.gsub(str, "%U", "U"))  -- AUAUUBUU 5

-- %w
str = "中文很6a"
print(string.gsub(str, "%w", "厲害"))  -- 中文很厲害厲害 2
print(string.gsub(str, "%W", "厲害"))  -- 厲害厲害厲害厲害厲害厲害厲害厲害厲害6a    9

-- %x
str = "MN1GeF"
print(string.gsub(str, "%x", "o"))  -- MNoGoo   3
print(string.gsub(str, "%X", "o"))  -- oo1oeF   3

-- %z
str = "0123489\0a"
print(string.gsub(str, "%z", "零"))  -- 0123489零a    1
print(string.gsub(str, "%Z", "零"))  -- 零零零零零零零  8

特殊元字元的例子：

-- .
local str = "a1&"
print(string.gsub(str, ".", "x"))  -- xxx   3

-- %
str = "%ab*%%"
print(string.gsub(str, "%%", "x"))  -- xab*xx   3
print(string.gsub(str, "%*", "y"))  -- %aby%%   1

-- ()
str = "<body>主幹</body>"
print(string.match(str, "<body>.+</body>"))  -- <body>主幹</body>
print(string.match(str, "<body>(.+)</body>"))  -- 主幹

-- []
str = "ab3cc8dmf,xx"
print(string.gsub(str, "[a5-8m-n,]", "z"))  -- zb3cczdzfzxx 4
print(string.gsub(str, "[^a5-8m-n,]", "z"))  -- azzzz8zmz,zz    8
--[[
    說明：
    "[^...]"會匹配不在...中的集合，即...的補集，例如"[^%d]"為匹配非數字字元，和"[%D]"效果一樣
    而"^..."匹配的是以...開頭，例如"^%d+"為以數字開頭的匹配
]]

-- ^
print(string.match("1abc", "^%d"))  -- 1
print(string.match("a1bc", "^%d"))  -- nil

-- $
print(string.match("abc1", "%d$"))  -- 1
print(string.match("ab1c", "%d$"))  -- nil

-- +
str = "ab12345ed"
print(string.match(str, "%d+"))  -- 12345

-- * -
str = "<a><b><c>"
print(string.gsub(str, "<.*>", "{ok}"))  -- {ok}    1
print(string.gsub(str, "<.->", "{ok}"))  -- {ok}{ok}{ok}    3
--[[
    說明：
    *和-比較類似，只是*進行最長匹配，而-是進行最短匹配
    所以在例子中使用*進行匹配的時候，會匹配第一個"<"到最後一個">"之間的所有內容進行替換，只匹配到了一次
    而使用-進行匹配的時候，則會第一個"<"到第一個">"之間的內容進行替換，一共匹配到了3次
]]

-- ?
print(string.match("abc100", "[+-]?%d+"))  -- 100
print(string.match("abc-100", "[+-]?%d+"))  -- -100
print(string.match("abc+100", "[+-]?%d+"))  -- +100
--[[
    說明：
    ?是匹配前一字元0次或1次
    在例子中即匹配字元類"[+-]"0次或1次，將這個匹配模式稍微改動一下，改成"^[+-]?%d+$"就可以檢查這個字串是否是整數了
]]

簡單的應用：

-- 判斷字串是否為純數字字串
function judgeNumString(str)
    return string.match(str, "%d+") == str
end

local str1 = "3497439"
local str2 = "83048a389b"

print(judgeNumString(str1), judgeNumString(str2))  -- true  false

-- 判斷是否是手機號碼（大陸）
function judgePhoneNum(str)
    return string.match(str,"[1][3-9]%d%d%d%d%d%d%d%d%d") == str
end

str1 = "13347823759"
str2 = "10348932849"

print(judgePhoneNum(str1), judgePhoneNum(str2))  -- true    false

參考：

Lua中正則表示式的使用整理

在Lua中使用正則表示式進行模式匹配的string庫函式有這四個： string.find(str, pattern[, init[, plain]]) string.gsub(str, patte

lua中正則表示式的坑

我在使用OpenResty編寫lua程式碼時，需要使用到lua的正則表示式，其中pattern是這樣的，--熱水器設定時間 local s = '12:33' local pattern = "(20|21|22|23|[01][0-9]):([0-5][0-9])" loc

php 中正則表示式詳解

概述正則表示式是一種描述字串結果的語法規則，是一個特定的格式化模式，可以匹配、替換、擷取匹配的字串。常用的語言基本上都有正則表示式，如JavaScript、java等。其實，只有瞭解一種語言的正則使用，其他語言的正則使用起來，就相對簡單些。文字主要圍繞解決下面問題展開。有哪些常用的

Python中正則表示式re.match的用法

re.match(pattern, string, flags) 第一個引數是正則表示式,如果匹配成功，則返回一個Match，否則返回一個None；第二個引數表示要匹配的字串；第三個引數是標緻位，用於控制正則表示式的匹配方式，如：是否區分大小寫，多行匹配等等。需要特別注意的是，這個方法並不是完

WPF中正則表示式的部分應用

無論在哪一種語言中，正則表示式在一定程度上都可以簡化程式碼程式設計。以下為在WPF中的部分應用。如var sql = new System.Text.RegularExpressions.Regex("[\\r\\n]").Replace(str, " "); 表示對str字串中匹配換行符

Python中正則表示式常用函式sub,search,findall,split等使用

1.原生字串r python中字串前面加上 r 表示原生字串,不會轉義。與大多數程式語言相同，正則表示式裡使用"\"作為轉義字元，這就可能造成反斜槓困擾。假如你需要匹配文字中的字元"\"，那麼使用程式語言表示的正則表示式裡將需要4個反斜槓"\\"：前兩個和後兩個分別用於在程式語言裡轉義成反斜

Python中正則表示式對單個字元，多個字元，匹配邊界等使用

Regular Expression，正則表示式，又稱正規表示式、正規表示法、正則表示式、規則表示式、常規表示法（英語：Regular Expression，在程式碼中常簡寫為regex、regexp或RE），是電腦科學的一個概

js中正則表示式test()方法

正則表示式即描述字串規則的表示式 /pattern/attrs /規則/屬性 new RegExp(pattern,attrs) regexObj.test(str)方法:測試正則表示式與指定字串是否匹

java中正則表示式的瞭解與實踐記錄

Pattern pattern = Pattern.compile("^\\S+/q/"); Matcher matcher = pattern.matcher(resultString); String qrcode=""; while(matcher.find()){ String path

Java中正則表示式相關類Pattern和Matcher的使用

在Java中，java.util.regex包定義了正則表示式使用到的相關類，其中最主要的兩個類為：Pattern、Matcher： Pattern 編譯正則表示式後建立一個匹配模式； Matcher 使用Pattern例項提供的正則表示式對目標字串進行匹

python中正則表示式1

1.模式語言 1）任何字元只與其本身匹配 2）"."匹配任意字元 3）"*" 表示其前面那個字元可匹配0個或任意多個相同字元 4）"^"只匹配目標串的開頭 5）"$"只匹配目標串的結尾 2.原始字串定義:在常規字串前加上r或者R字首. r'd:\test\1.t

Java中正則表示式

字元類: [abc] a、b 或 c [^abc] 任何字元,除了abc [a-zA-Z] a 到 z 或 A 到 Z ,兩頭的字母包括在內 [0-9] 0到9 的字元都包括預定義字元類: . 任何字元 \d 數字:[0-9] 示例:判斷手機號的規則: String regex = “

JavaScript正則表示式整理

只能輸入字串為數字：“^[-+]?[0-9]+\.[0-9]+$” 只能輸入數字："^[0-9]*$" 只能輸入 n 位的數字："^\d{n}$" 只能輸入至少 n 位的數字："^\d{n,}$" 只能輸入 m ～ n 位的數字："^\d{m,n}$" 只能輸入零和非零開頭

python中正則表示式的使用

正則表示式 python中需要使用正則表示式對字串進行匹配的時候，需要匯入re模組 #coding=utf-8 # 匯入re模組 import re # 使用match方法進行匹配操作 result = re.match(正

Python正則表示式整理

Python正則表示式整理一、正則表示式介紹在不使用正則表示式的情況下，我們想要實現字串的匹配就必須要單獨的建立一個函式，通過呼叫函式來實現；為了減少程式碼的編寫，我們不妨將這些函式抽象出來，成為一個規則。正則表示式概念 1、使用單個字串來描述匹配一系列符合某個句法規

Python中正則表示式介紹

正則正則表通常是用來檢索、替換那些符合某個模式(規則)的文字。也就是說使用正則表示式可以在字串中匹配出你需要的字元或者字串，甚至可以替換你不需要的字元或者字串。正則（不是python特有的）匹配字串,其他語言也有正則表示式例項：需求：輸入字元，判斷字

常用的正則表示式整理【轉載，防丟失】

轉載文章，好資源，防丟失。原文連結： http://blog.cspojie.cn/2017/09/26/常用的正則表示式整理/ 一、校驗數字的表示式 1 數字： ^[0-9]$ 2 n位的數字： ^\d{n}$ 3 至少n位的數字： ^\d{n,}$ 4 m-n位的數字：^

1000行程式碼徒手寫正則表示式引擎【1】--JAVA中正則表示式的使用

簡介：本文是系列部落格的第一篇，主要講解和分析正則表示式規則以及JAVA中原生正則表示式引擎的使用。在後續的文章中會涉及基於NFA的正則表示式引擎內部的工作原理，並在此基礎上用1000行左右的JAVA程式碼,實現一個支援常用功能的正則表示式引擎。它支援貪婪匹配和懶惰匹配；支援零寬度字元（如“\b”， “\B

常用的 JS正則表示式整理

一、校驗數字的表示式 1 數字：^[0-9]*$ 2 n位的數字：^\d{n}$ 3 至少n位的數字：^\d{n,}$ 4 m-n位的數字：^\d{m,n}$ 5 零和非零開頭的數字：^(0|[1-9][0-9]*)$ 6 非零開頭的最多帶兩位小數的數字：^([

javascript中正則表示式的基礎語法

前面的話　　正則表示式在人們的印象中可能是一堆無法理解的字元，但就是這些符號卻實現了字串的高效操作。通常的情況是，問題本身並不複雜，但沒有正則表示式就成了大問題。javascript中的正則表示式作為相當重要的知識，本文將介紹正則表示式的基礎語法定義　　正則表示式(Regular Expres

Lua中正則表示式的使用整理

相關推薦