Linux Shell 萬用字元、元字元、轉義符
說到shell萬用字元(wildcard),大家在使用時候會經常用到。下面是一個例項:
[[email protected] ~/shell]$ ls
a.txt b.txt c.old
[[email protected] ~/shell]$ ls *.txt
a.txt b.txt
[[email protected] ~/shell]$ ls d*.txt
ls: 無法訪問 d*.txt: 沒有那個檔案或目錄
從上面這個例項,不知道大家有沒有發現問題呢。我們先了解一下,萬用字元相關知識,再分析下這個例項吧。
一、linux shell萬用字元(wildcard)
萬用字元是由shell處理的(不是由所涉及到命令語句處理的,其實我們在shell各個命令中也沒有發現有這些萬用字元介紹), 它只會出現在 命令的“引數”裡(它不用在 命令名稱裡, 也不用在 操作符上)。當shell在“引數”中遇到了萬用字元時,shell會將其當作路徑或檔名去在磁碟上搜尋可能的匹配:若符合要求的匹配存在,則進行代換(路徑擴充套件);否則就將該萬用字元作為一個普通字元傳遞給“命令”,然後再由命令進行處理。總之,萬用字元 實際上就是一種shell實現的路徑擴充套件功能。在 萬用字元被處理後, shell會先完成該命令的重組,然後再繼續處理重組後的命令,直至執行該命令。
我們回過頭分析上面命令吧:在第2個命令中,*.txt 實際shell搜尋檔案,找到了符合條件的檔案,命令會變成:ls a.txt b.txt ,實際在執行ls 時候傳給它的是a.txt b.txt .
而命令3,d*.txt 由於當前目錄下面沒有這樣的檔案或目錄,直接將”d*.txt” 作為ls 引數,傳給了 ls .這個時候”*” 只是一個普通的 ls 引數而已,已經失去了它通配意義。 由於找不到檔案,所以會出現:無法訪問提示!
瞭解了shell萬用字元,我們現在看下,shell常見萬用字元有那一些了。
shell常見萬用字元:
需要說明的是:萬用字元看起來有點象正則表示式語句,但是它與正則表示式不同的,不能相互混淆。把萬用字元理解為shell 特殊代號字元就可。而且涉及的只有,*,? [] ,{} 這幾種。
二、shell元字元(特殊字元 Meta)
shell 除了有萬用字元之外,由shell 負責預先先解析後,將處理結果傳給命令列之外,shell還有一系列自己的其他特殊字元。
加入”*” 都是作用在命令名直接。可以看到shell 元字元,基本是作用在命令上面,用作多命令分割(或者引數分割)。因此看到與萬用字元有相同的字元,但是實際上作用範圍不同。所以不會出現混淆。
以下是man bash 得到的英文解析:
metacharacter
A character that, when unquoted, separates words. One of the following:
| & ; ( ) < > space tab
control operator
A token that performs a control function. It is one of the following symbols:
|| & && ; ;; ( ) | <newline>
三、shell轉義符
有時候,我們想讓 萬用字元,或者元字元 變成普通字元,不需要使用它。那麼這裡我們就需要用到轉義符了。 shell提供轉義符有三種。
man bash 英文解釋如下:
There are three quoting mechanisms: the escape character, single quotes, and double quotes.
例項:
[[email protected] ~/shell]$ ls *.txt
ls: 無法訪問 *.txt: 沒有那個檔案或目錄
[[email protected] ~/shell]$ ls '*.txt'
ls: 無法訪問 *.txt: 沒有那個檔案或目錄
[[email protected] ~/shell]$ ls 'a.txt'
a.txt
[[email protected] ~/shell]$ ls *.txt
a.txt b.txt
可以看到,加入了轉義符 “*”已經失去了萬用字元意義了。
四、shell解析指令碼的過程
看到上面說的這些,想必大家會問到這個問題是,有這麼想特殊字元,萬用字元,那麼 shell在得到一條命令,到達是怎麼樣處理的呢?我們看下下面的圖:
如果用雙引號包括起來,shell檢測跳過了1-4步和9-10步,單引號包括起來,shell檢測就會跳過了1-10步。也就是說,雙引號 只經過引數擴充套件、命令代換和算術代換就可以送入執行步驟,而單引號轉義符直接會被送入執行步驟。而且,無論是雙引號轉義符還是單引號轉義符在執行的時候能夠告訴各個命令自身內部是一體的,但是其本身在執行時是並不是命令中文字的一部分。