4月12日學習筆記，grep和正則表示式，擴充套件正則表示式

阿新 • • 發佈：2022-04-12

day28學習筆記（4月12日）

正則表示式和擴充套件正則表示式

萬用字元和正則的區別

1.從語法上就記住，只有awk、gre、sed才識別正則表示式符號、其他都是萬用字元

2.從用法上區分

表示式操作的是檔案、目錄名（屬於是萬用字元）
表示式操作的是檔案內容（正則表示式）

什麼是正則表示式

正則表示式就是為了處理大量的字串而定義的一套規則和方法。
通過定義的這些特殊符號的輔助，系統管理員就可以快速過濾，替換或輸出需要的字串。
Linux 正則表示式一般以行為單位處理的。

如何用正則表示式

通常Linux運維工作，都是面臨大量帶有字串的內容，如

配置檔案
程式程式碼
命令輸出結果
日誌檔案

且此類字串內容，我們常會有特定的需要，查找出符合工作需要的特定的字串，因此正則表示式就出現了

正則表示式是一套規則和方法
正則工作時以單位進行，一次處理一行
正則表示式化繁為簡，提高工作效率
linux僅受三劍客（sed、awk、grep）支援，其他命令無法使用

學正則的注意事項

正則表示式應用非常廣泛，很多程式語言都支援正則表示式，用於處理字串提取資料。
Linux下普通命令無法使用正則表示式的，只能使用linux下的三個命令，結合正則表示式處理。
- sed
- grep
- awk
萬用字元是大部分普通命令都支援的，用於查詢檔案或目錄
而正則表示式是通過三劍客命令在檔案（資料流）中過濾內容的，注意區別

以及注意字符集，需要設定LC_ALL=C，注意這一點很重要

關於字符集設定

你會發現很多shell腳本里都有這麼一個語句如下

作用是修改linux的字符集，通過locale命令可以檢視本地字符集設定

linux通過如下變數設定程式執行的不同語言環境，如中文、英文環境。

[root@yuchao-tx-server ~]# locale
LANG=en_US.UTF-8
LC_CTYPE="zh_CN.UTF-8"
LC_NUMERIC="zh_CN.UTF-8"
LC_TIME="zh_CN.UTF-8"
LC_COLLATE="zh_CN.UTF-8"
LC_MONETARY="zh_CN.UTF-8"
LC_MESSAGES="zh_CN.UTF-8"
LC_PAPER="zh_CN.UTF-8"
LC_NAME="zh_CN.UTF-8"
LC_ADDRESS="zh_CN.UTF-8"
LC_TELEPHONE="zh_CN.UTF-8"
LC_MEASUREMENT="zh_CN.UTF-8"
LC_IDENTIFICATION="zh_CN.UTF-8"
LC_ALL=zh_CN.UTF-8

一般我們會使用$LANG變數來設定linux的字符集，一般設定為我們所在的地區，如zh_CN.UTF-8

[root@yuchao-tx-server ~]# echo $LANG
en_US.UTF-8

為了讓系統能正確執行shell語句（由於自定義修改的不同語言環境，對一些特殊符號的處理區別，如中文輸入法，英文輸入法下的標點符號等，導致shell無法執行）

我們會使用如下語句，恢復linux的所有的本地化設定，恢復系統到初始化的語言環境。

[root@yuchao-tx-server ~]# export LC_ALL=C

正則表示式分類

使用正則表示式的問題是、有兩大類正則表示式規範、linux不同的應用程式，會使用不同的正則表示式。

例如

不同的程式語言使用正則（python,java）
Linux實用工具（sed、awk、grep）
其他軟體使用正則（mysql、nginx）

正則表示式是通過正則表示式引擎（regular expression engine）實現的。正則表示式引擎是一套底層軟體，負責解釋正則表示式模式並使用這些模式進行文字匹配。

在Linux中，有兩種流行的正則表示式引擎：

基於unix標準下的正則表示式符號規則有兩類：
POSIX基礎正則表示式（basic regular expression，BRE）引擎

POSIX擴充套件正則表示式（extended regular expression，ERE）引擎 

解釋posix
POSIX（Portable Operating System Interface）是Unix系統的一個設計標準。
當年最早的Unix，原始碼流傳出去了，加上早期的Unix不夠完善，於是之後出現了好些獨立開發的與Unix基本相容但又不完全相容的OS，通稱Unix-like OS

兩類、正則表示式符號

linux規範將正則表示式分為了兩種

基本正則表示式（BRE、basic regular expression）

BRE對應元字元有 
^ $ . [ ] *

其他符號是普通字元
; \

擴充套件正則表示式（ERE、extended regular expression）

ERE在在BRE基礎上，增加了
( ) { } ? + |  等元字元

轉義符

反斜槓 \
反斜槓用於在元字元前新增，使其成為普通字元

正則符號

字元	描述	示例
\	轉義字元，將特殊符號進行轉義，忽略其特殊意義	`a\.b`只匹配`a.b`不能匹配acb
^	grep匹配最左側字元，表示匹配以什麼開頭	^yy，表示以yy開頭的行
$	grep匹配行末	yy$表示以yy結尾
^$	表示空行
.	匹配除了換行符意外的所有內容，字元+空格（不匹配換行符和空行）	ab. 能匹配abc，abd
.$	匹配任意符號結尾的行
*	匹配前一個字元連續出現0次或n次，即匹配所有內容
.*	匹配任意內容的行，包括空行
^.*	匹配任意多個字元開頭的行，包括空行
[ ]	匹配括號內的字元或數字	[abc]，a或b或c

擴充套件正則符號

字元	描述	示例
+	前面字元出現1次或n次	go+d 匹配結果可以是god,good,goood
（）	建立一個字元組	max(tri)?匹配max或maxtri
？	匹配前一項0次或1次	go?d 匹配結果只能是god,good
{n}	匹配之前的項n次，n是可以為0的正整數	[0-9]{3}匹配任意一個三位數，可以擴充套件為`[0-9][0-9][0-9][0-9]`
{n,}	之前的項至少需要匹配N次	[0-9]{2,}匹配任意一個兩位數或更多位數
{n,m}	指定之前的項至少匹配n次，最多匹配m次,n<=m	[0-9]{2,5}匹配任意一個兩位數或者更多位數
\|	交替匹配兩邊任意一項	ab(c\|d)，匹配abc或abd

正則記憶表

4月12日學習筆記，grep和正則表示式，擴充套件正則表示式

day28學習筆記（4月12日）正則表示式和擴充套件正則表示式萬用字元和正則的區別

4月1日學習筆記，LAMP架構在阿里雲搭建網站

day22學習筆記（4月1日） LAMP與阿里雲 LAMP的概念 LAMP是公認的最常見、最古老的黃金Web技術棧

4月7日學習筆記，磁碟管理二（inode、軟連結、硬連結、Raid磁碟冗餘陣列）

day25學習筆記（4月7日）磁碟管理二（inode、軟連結、硬連結、Raid磁碟冗餘陣列）

4月8日學習筆記，LVM邏輯卷管理

day26學習筆記（4月8日） lvm邏輯卷管理 lvm是什麼 LVM(Logical Volume Manager)邏輯卷管理，是一種將一個或多個硬碟的分割槽在邏輯上集合，相當於一個大硬碟來使用，當硬碟的空間不夠使用的時候，可以繼續將其它的硬

4月11日學習筆記，萬用字元和特殊符號

day27學習筆記（4月11日）萬用字元萬用字元語法、作用字元說明示例 * 匹配任意（0或多個）字串，包括空字串

4月14日學習筆記，awk格式化資料

day30學習筆記，（4月14日） awk awk是什麼 grep，擅長單純的查詢或匹配文字內容 sed，更適合編輯、處理匹配到的文字內容

4月19日學習筆記，samba檔案共享服務

samba服務端的部署 client、server軟體的使用，部署流程 1.安裝samba軟體 yum install samba -y

4月21日學習筆記，Rsync定時備份實戰

day34筆記（4月21日）備份任務實戰今天的任務主要以實際備份任務入手，完成綜合練習，完成對rsync的綜合運用。

4月20日學習筆記,Rsync資料複製

day33學習筆記（4月20日） Rsync資料複製 Rsync服務概念特性 Rsync是一款開源的、快速的、多功能的、可實現全量及增量的本地或遠端資料同步備份的優秀工具。並且可以不進行改變原有資料的屬性資訊，實現資料的備份遷

英偉達將於 4 月 12 日舉辦 GTC 2021 技術大會：將介紹深度學習、AI 等技術

2月5日訊息據外媒 Hexus 訊息，英偉達今日正式宣佈將於今年 4 月 12 日 - 16 日舉辦 GTC 2021 GPU 技術大會。本次大會將由英偉達 CEO 黃仁勳做開場演講，此後將進行 GTC 討論會、深度學習研究學會（DLI）工作坊、以及

《異界之上》將於4月12日EA上線，魔物娘聲優徵集同步開啟

高自由度動作地牢冒險遊戲《異界之上》即將於4月12日開啟EA，屆時玩家將能夠深入這座異世界城堡中開啟冒險，與更多的魔物娘邂逅，獲得她們的祝福能力，為遊戲的冒險帶來更加豐富的變化。隨著《異界之上》EA的到來，遊

《蜘蛛俠：英雄無歸》數字版 3 月 22 日上線，4K & 藍光碟 4 月 12 日推出

【更新】索尼推特確認《蜘蛛俠：英雄無歸》數字版 3 月 22 日上線，4K & 藍光碟將於 4 月 12 日推出。 2 月 23 日訊息，電商平臺百思買（Bestbuy）顯示《蜘蛛俠：英雄無歸》4K 藍光版將在 4 月 12 日推出，售價為

3月22日學習筆記，防火牆服務和定時任務服務

day16 學習筆記（3月22日）防火牆概念：防火牆實際是是帶有一些小孔的牆。這些小孔就是用來留給那些允許進行的通訊，在這些小孔中安裝了過濾機制，就是防火牆的過濾策略了。

3月23日學習筆記，程序資源管理

day17學習筆記（3月23日）程序資源管理什麼是資源管理硬體角度磁碟資源磁碟的容量空間，可以儲存電影、文件、資料等）

3月25日學習筆記，軟體包管理

day19學習筆記（3.25）軟體包管理什麼是軟體包？軟體包是電腦程式program，是一個程式語言寫好的程式碼檔案，裡面包含了該語言的指令及各種字元等。

OPPO F21 Pro 5G 手機將在 4 月 12 日釋出：直邊邊框，多層紋理塗層、玻璃纖維皮革設計

3 月 30 日訊息，據 gsmarena 報道，OPPO 在去年 3 月推出了 F19 系列，該公司將在下個月推出 F21 Pro 系列，即 4 月 12 日。這一訊息來自 Oppo 印度官方，F21 Pro 系列將於當地時間 4 月 12 日下午 5 點在印度推出

《饑荒聯機版》4 月 12 日起將登陸任天堂 Switch，支援 Xbox、WeGame、Steam 共享

3 月 31 日訊息，科雷娛樂公司（Klei）官方宣佈，《饑荒聯機版》將於 2022 年 4 月 12 日登陸 Nintendo Switch 平臺，此外新功能 \"shared unlocks\" 也將推出，屆時玩家將可以通過 Klei 賬戶在多個平臺之間共享已解

3月30日學習筆記，yum源配置

day20學習筆記（3月30日） yum精講 linux常見的基礎依賴環境 yum install gcc patch libffi-devel python-devel zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gdbm-de

夢幻西遊：門派大改4月12日測試，明秀園服戰老闆傳音找18門隊伍

大家好，我是如風，資深老玩家給你帶來關於夢幻的故事！（原創碼字不易，感謝關注點贊）

3月31日學習筆記，yum補充、Ubuntu系統

day21學習筆記(3月31日) yum補充、Ubuntu系統 yum知識補充 yum的配置檔案和檔案格式 yum的配置檔案/etc/yum.conf

4月12日學習筆記，grep和正則表示式，擴充套件正則表示式

day28學習筆記（4月12日）

正則表示式和擴充套件正則表示式

萬用字元和正則的區別

什麼是正則表示式

如何用正則表示式

學正則的注意事項

關於字符集設定

正則表示式分類

兩類、正則表示式符號

正則符號

擴充套件正則符號

正則記憶表

相關推薦