1. 程式人生 > >Shell 程式設計入門

Shell 程式設計入門

轉載自:https://github.com/qinjx/30min_guides/blob/master/shell.md

 

什麼是Shell指令碼

示例

看個例子吧:

#!/bin/sh
cd ~
mkdir shell_tut
cd shell_tut

for ((i=0; i<10; i++)); do
    touch test_$i.txt
done
示例解釋

 

示例解釋

  • 第1行:指定指令碼直譯器,這裡是用/bin/sh做直譯器的
  • 第2行:切換到當前使用者的home目錄
  • 第3行:建立一個目錄shell_tut
  • 第4行:切換到shell_tut目錄
  • 第5行:迴圈條件,一共迴圈10次
  • 第6行:建立一個test_0…9.txt檔案
  • 第7行:迴圈體結束

mkdir, touch都是系統自帶的程式,一般在/bin或者/usr/bin目錄下。for, do, done是sh指令碼語言的關鍵字。

 

shell和shell指令碼的概念

shell是指一種應用程式,這個應用程式提供了一個介面,使用者通過這個介面訪問作業系統核心的服務。Ken Thompson的sh是第一種Unix Shell,Windows Explorer是一個典型的圖形介面Shell。

shell指令碼(shell script),是一種為shell編寫的指令碼程式。業界所說的shell通常都是指shell指令碼,但讀者朋友要知道,shell和shell script是兩個不同的概念。由於習慣的原因,簡潔起見,本文出現的“shell程式設計”都是指shell指令碼程式設計,不是指開發shell自身(如Windows Explorer擴充套件開發)。

 

環境

shell程式設計跟java、php程式設計一樣,只要有一個能編寫程式碼的文字編輯器和一個能解釋執行的指令碼直譯器就可以了。

OS

當前主流的作業系統都支援shell程式設計,本文件所述的shell程式設計是指Linux下的shell,講的基本都是POSIX標準下的功能,所以,也適用於Unix及BSD(如Mac OS)。

Linux 

Linux預設安裝就帶了shell直譯器。

Mac OS  

Mac OS不僅帶了sh、bash這兩個最基礎的直譯器,還內建了ksh、csh、zsh等不常用的直譯器。

Windows上的模擬器

 windows出廠時沒有內建shell直譯器,需要自行安裝,為了同時能用grep, awk, curl等工具,最好裝一個cygwin或者mingw來模擬linux環境

 

指令碼直譯器

sh

即Bourne shell,POSIX(Portable Operating System Interface)標準的shell直譯器,它的二進位制檔案路徑通常是/bin/sh,由Bell Labs開發。

本文講的是sh,如果你使用其它語言用作shell程式設計,請自行參考相應語言的文件。

bash

Bash是Bourne shell的替代品,屬GNU Project,二進位制檔案路徑通常是/bin/bash。業界通常混用bash、sh、和shell,比如你會經常在招聘運維工程師的文案中見到:熟悉Linux Bash程式設計,精通Shell程式設計。

在Ubantu 16.04 裡,/bin/sh是一個指向/bin/dash的符號連結:

[email protected]:~$  ls -l /bin/*sh
-rwxr-xr-x 1 root root 1037528 5月  16  2017 /bin/bash
-rwxr-xr-x 1 root root  154072 2月  18  2016 /bin/dash
lrwxrwxrwx 1 root root       4 5月  16  2017 /bin/rbash -> bash
lrwxrwxrwx 1 root root       4 12月 15 11:06 /bin/sh -> dash
lrwxrwxrwx 1 root root       7 9月  23 10:48 /bin/static-sh -> busybox

但在Mac OS上不是,/bin/sh和/bin/bash是兩個不同的檔案,儘管它們的大小隻相差100位元組左右:

iMac:~ wuxiao$ ls -l /bin/*sh
-r-xr-xr-x  1 root  wheel  1371648  6 Nov 16:52 /bin/bash
-rwxr-xr-x  2 root  wheel   772992  6 Nov 16:52 /bin/csh
-r-xr-xr-x  1 root  wheel  2180736  6 Nov 16:52 /bin/ksh
-r-xr-xr-x  1 root  wheel  1371712  6 Nov 16:52 /bin/sh
-rwxr-xr-x  2 root  wheel   772992  6 Nov 16:52 /bin/tcsh
-rwxr-xr-x  1 root  wheel  1103984  6 Nov 16:52 /bin/zsh

 

高階程式語言

理論上講,只要一門語言提供瞭解釋器(而不僅是編譯器),這門語言就可以勝任指令碼程式設計,常見的解釋型語言都是可以用作指令碼程式設計的,如:Perl、Tcl、Python、PHP、Ruby。Perl是最老牌的指令碼程式語言了,Python這些年也成了一些linux發行版的預置直譯器。

編譯型語言,只要有直譯器,也可以用作指令碼程式設計,如C shell是內建的(/bin/csh),Java有第三方直譯器Jshell,Ada有收費的直譯器AdaScript。

 

如下是一個PHP Shell Script示例(假設檔名叫test.php):

#!/usr/bin/php
<?php
for ($i=0; $i < 10; $i++)
        echo $i . "\n";

執行:

/usr/bin/php test.php

或者:

chmod +x test.php
./test.php

 

 

如何選擇shell程式語言

熟悉 vs 陌生

如果你已經掌握了一門程式語言(如PHP、Python、Java、JavaScript),建議你就直接使用這門語言編寫指令碼程式,雖然某些地方會有點囉嗦,但你能利用在這門語言領域裡的經驗(單元測試、單步除錯、IDE、第三方類庫)。

新增的學習成本很小,只要學會怎麼使用shell直譯器(Jshell、AdaScript)就可以了。

 

簡單 vs 高階

如果你覺得自己熟悉的語言(如Java、C)寫shell指令碼實在太囉嗦,你只是想做一些備份檔案、安裝軟體、下載資料之類的事情,學著使用sh,bash會是一個好主意。

shell只定義了一個非常簡單的程式語言,所以,如果你的指令碼程式複雜度較高,或者要操作的資料結構比較複雜,那麼還是應該使用Python、Perl這樣的指令碼語言,或者是你本來就已經很擅長的高階語言。因為sh和bash在這方面很弱,比如說:

  • 它的函式只能返回字串,無法返回陣列
  • 它不支援面向物件,你無法實現一些優雅的設計模式
  • 它是解釋型的,一邊解釋一邊執行,連PHP那種預編譯都不是,如果你的指令碼包含錯誤(例如呼叫了不存在的函式),只要沒執行到這一行,就不會報錯

 

環境相容性

如果你的指令碼是提供給別的使用者使用,使用sh或者bash,你的指令碼將具有最好的環境相容性,perl很早就是linux標配了,python這些年也成了一些linux發行版的標配,至於mac os,它預設安裝了perl、python、ruby、php、java等主流程式語言。

 

第一個shell指令碼

編寫

開啟文字編輯器,新建一個檔案,副檔名為sh(sh代表shell),副檔名並不影響指令碼執行,見名知意就好,如果你用php寫shell 指令碼,副檔名就用php好了。

輸入一些程式碼,第一行一般是這樣:

#!/bin/bash
#!/usr/bin/php

“#!”是一個約定的標記,它告訴系統這個指令碼需要什麼直譯器來執行。(在shell指令碼中"#“用來標記註釋,”#!“除外)

 

執行

執行Shell指令碼有兩種方法:

作為可執行程式

chmod +x test.sh
./test.sh

或者:

chmod +x test.sh
./test.sh

 

注意,一定要寫成./test.sh,而不是test.sh,執行其它二進位制的程式也一樣,直接寫test.sh,linux系統會去PATH裡尋找有沒有叫test.sh的,而只有/bin, /sbin, /usr/bin,/usr/sbin等在PATH裡,你的當前目錄通常不在PATH裡,所以寫成test.sh是會找不到命令的,要用./test.sh告訴系統說,就在當前目錄找。

通過這種方式執行bash指令碼,第一行一定要寫對,好讓系統查詢到正確的直譯器。

這裡的"系統",其實就是shell這個應用程式(想象一下Windows Explorer),但我故意寫成系統,是方便理解,既然這個系統就是指shell,那麼一個使用/bin/sh作為直譯器的指令碼是不是可以省去第一行呢?是的。

 

作為直譯器引數

這種執行方式是,直接執行直譯器,其引數就是shell指令碼的檔名,如:

/bin/sh test.sh
/bin/php test.php

或者:

sh test.sh
bash test.sh
php test.sh

 

這種方式執行的指令碼,不需要在第一行指定直譯器資訊,寫了也沒用。

 

補充知識: 檔案的屬性

通過ls -l命令可以檢視檔案的屬性,例如檢視新建檔案test.sh的屬性:

[email protected]:~$ touch test.sh
[email protected]:~$ ls -l test.sh
-rw-rw-r-- 1 rogn rogn 0 12月 15 11:38 test.sh

 

可以看到,一般新建檔案的預設屬性是-rw-rw-r--,即664,不具有可執行屬性x,可使用chmod命令來改變檔案屬性(修改預設屬性則使用umask命令),例如將檔案test.sh的屬性改為可讀可寫可執行(rwx: 4 + 2 + 1 = 7):

[email protected]:~$ chmod 777 test.sh
[email protected]:~$ ls -l test.sh
-rwxrwxrwx 1 rogn rogn 0 12月 15 11:38 test.sh

 

變數

定義變數

定義變數時,變數名不加美元符號($),如:

your_name="qinjx"

注意,變數名和等號之間不能有空格,這可能和你熟悉的所有程式語言都不一樣。

除了顯式地直接賦值,還可以用語句(list)給變數賦值,如:

for language `C C++ python Java`

 

刪除變數

可以使用 unset 刪除變數,但是不能刪除只讀變數。變數刪除後不能再次使用。

my_var="haha"
unset my_var
echo ${my_var} # 變數my_var已被刪除,沒有任何輸出

 

使用變數

使用一個定義過的變數,只要在變數名前面加美元符號即可,如:

your_name="qinjx"
echo $your_name
echo ${your_name}

變數名外面的花括號是可選的,加不加都行,加花括號是為了幫助直譯器識別變數的邊界(避免二義性),比如下面這種情況:

for skill in Ada Coffe Action Java; do
    echo "I am good at ${skill}Script"
done

如果不給skill變數加花括號,寫成echo "I am good at $skillScript",直譯器就會把$skillScript當成一個變數(其值為空),程式碼執行結果就不是我們期望的樣子了。

推薦給所有變數加上花括號,這是個好的程式設計習慣。IntelliJ IDEA編寫shell script時,IDE就會提示加花括號。

 

重定義變數

已定義的變數,可以被重新定義,如:

your_name="qinjx"
echo $your_name

your_name="alibaba"
echo $your_name

這樣寫是合法的,但注意,第二次賦值的時候不能寫$your_name="alibaba",使用變數的時候才加美元符。

 

註釋

以“#”開頭的行就是註釋,會被直譯器忽略。("#!"除外)

多行註釋

sh裡沒有多行註釋,只能每一行加一個#號。就像這樣:

#--------------------------------------------
# 這是一個自動打ipa的指令碼,基於webfrogs的ipa-build書寫:https://github.com/webfrogs/xcode_shell/blob/master/ipa-build

# 功能:自動為etao ios app打包,產出物為14個渠道的ipa包
# 特色:全自動打包,不需要輸入任何引數
#--------------------------------------------

##### 使用者配置區 開始 #####
#
#
# 專案根目錄,推薦將此指令碼放在專案的根目錄,這裡就不用改了
# 應用名,確保和Xcode裡Product下的target_name.app名字一致
#
##### 使用者配置區 結束  #####

 

如果在開發過程中,遇到大段的程式碼需要臨時註釋起來,過一會兒又取消註釋,怎麼辦呢?每一行加個#符號太費力了,可以把這一段要註釋的程式碼用一對花括號括起來,定義成一個函式,沒有地方呼叫這個函式,這塊程式碼就不會執行,達到了和註釋一樣的效果。

 

字串

字串是shell程式設計中最常用最有用的資料型別(除了數字和字串,也沒啥其它型別好用了,哈哈),字串可以用單引號,也可以用雙引號,也可以不用引號。單雙引號的區別跟PHP類似。

單引號

str='this is a string'

單引號字串的限制:

  • 單引號裡的任何字元都會原樣輸出,單引號字串中的變數是無效的
  • 單引號字串中不能出現單引號(對單引號使用轉義符後也不行)

雙引號

your_name='qinjx'
str="Hello, I know your are \"$your_name\"! \n"
  • 雙引號裡可以有變數
  • 雙引號裡可以出現轉義字元

效果如下:

[email protected]:~$ cat test.sh
your_name='qinjx'
str="Hello, I know your are \"$your_name\"! \n"
echo $str
[email protected]:~$ sh test.sh
Hello, I know your are "qinjx"! 

[email protected]:~$ 

 

字串操作

參見本文件末尾的參考資料中Advanced Bash-Scripting Guid Chapter 10.1

 

陣列

管道

條件判斷

流程控制

for while

for

在開篇的示例裡演示過了:

for var in item1 item2 ... itemN
do
    command1
    command2
    ...
    commandN
done

寫成一行:

for var in item1 item2 ... itemN; do command1; command2… done;

 

C風格的for

for (( EXP1; EXP2; EXP3 ))
do
    command1
    command2
    command3
done

 

補充知識:

在Ubantu16.04上執行C風格的for會提示 “syntax error: Bad for loop variable”,從 ubuntu 6.10 開始,ubuntu 就將先前預設的bash shell 更換成了dash shell;其表現為 /bin/sh 連結倒了/bin/dash而不是傳統的/bin/bash。 

[email protected]:~$ echo $SHELL
/bin/bash
[email protected]:~$ ls -l /bin/*sh
-rwxr-xr-x 1 root root 1037528 5月  16  2017 /bin/bash
-rwxr-xr-x 1 root root  154072 2月  18  2016 /bin/dash
lrwxrwxrwx 1 root root       4 5月  16  2017 /bin/rbash -> bash
lrwxrwxrwx 1 root root       4 12月 15 11:06 /bin/sh -> dash
lrwxrwxrwx 1 root root       7 9月  23 10:48 /bin/static-sh -> busybox

解決方法:將預設的shell改回bash。在終端執行 sudo dpkg-reconfigure dash,然後選 擇 no。(如果想要改回bash,同樣執行這條命令,選擇“Yes”)。

 其實還有一種簡單的方法:直接使用dash執行,例如:dash test.sh

while

while condition
do
    command
done

 

無限迴圈

while :
do
    command
done

或者

while true
do
    command
done

或者

for (( ; ; ))

 

函式

檔案包含

使用者輸入

常用的命令

sh指令碼結合系統命令便有了強大的威力,在字元處理領域,有grep、awk、sed三劍客,grep負責找出特定的行,awk能將行拆分成多個欄位,sed則可以實現更新插入刪除等寫操作。

ps

檢視程序列表

grep

  • 排除grep自身

  • 查詢與target相鄰的結果

awk

sed

  • 插入

  • 替換

  • 刪除

xargs

curl

綜合案例

參考資料