awk知識點全回顧

阿新 • • 發佈：2017-09-12

次數動作正則表達式 pro 新的 n) express 數值轉換建議

本文目錄：
1.awk簡介和基本語法格式
2.print和printf格式化輸出
3.輸入行的字段分隔符和行分隔符
4.BGEIN和END
5.數組
6.流程控制語句
　　6.1 條件判斷語句
　　6.2 while循環
　　6.3 do循環
　　6.4 for循環
7.更完整的awk程序格式和表達式
8.awk中的變量
9.awk中的內置函數
10.自定義函數
11.getline函數
12.向awk傳遞變量

1. awk簡介和基本語法格式

Awk自動地搜索輸入文件，並把每一個輸入行切分成字段。許多工作都是自動完成的，例如讀取每個輸入行、字段分割、存儲管理、初始化等。在AWK中不需聲明變量數據類型，它內置字符串類型和數值類型。

一般來說，在CentOS上安裝的awk默認是gawk。它的調用格式為：

awk [OPTIONS] -f program_file [--] filename_list
awk [OPTIONS] [--] program filename_list

program是awk程序的重中之重，稱為awk的程序，它的格式為PATTERN{ACTIONS}。awk每讀入一行，都會先與PATTERN做匹配比較，當找到符合條件的數據就執行對應的ACTION。

其中PATTERN或ACTIONS二者可省一。省略PATTERN時表示對所有行都執行ACTIONS，省略ACTIONS表示對符合條件的行執行默認的print動作。因為二者可省一，所以用大括號{}將ACTIONS部分包圍起來，以區分PATTERN和ACTIONS。

一個簡單的例子，輸出/etc/passwd中用戶shell為/bin/bash的用戶名，其中使用"-F"選項指定冒號作為分隔符。

awk -F‘:‘ ‘$7 == "/bin/bash"{print "who use bash shell: ",$1}‘ /etc/passwd

其中位置變量$1,$2...為該行的第幾個字段，"$0"表示整行。

如果要輸出多個字段，則字段之間使用逗號","分隔，例如{print $1,$5}。但輸出時，仍默認以空格分隔各輸出字段。

如果action為print $1 $5，則結果會將"$1"和"$5"拼接在一起，因為空格是awk中的拼接字符。例如變量賦值name = "abc" "bcd"

等價於name="abcbcd"。其實不算是拼接符，而是因為awk會忽略任何不被引號包圍的空白。

2.print和printf格式化輸出

awk使用print和printf輸出數據，不僅可以輸出到標準輸出中，還可以重定向到文件中，使用管道傳遞給另一個命令。

print
將 $0 打印到標準輸出。等價於print $0。
print expression, expression, …
打印各個 expression, expression 之間由 OFS 分開, 由 ORS 終止
print expression,expression,… > filename
文件名filename必須使用雙引號包圍，否則被當作變量。且文件只會被打開一次。
print expression,expression,… >> filename
print expression,expression,… | command
將數據傳遞給系統命令。命令需要使用雙引號包圍。
printf(format,expression,expression,…)
printf(format,expression,expression,…) > filename
printf(format,expression,expression,…) >> filename
printf(format,expression,expression,…) | command
close(filename), close( command)
斷開 print 與 filename (或 command) 之間的連接
system(command)
執行 command; 函數的返回值是 command 的退出狀態

如果print或printf的參數列表中含有操作符，則需要使用括號包圍，否則容易產生歧義。如：

print($1, $3) > ($3 > 100 ? "bigpop" : "smallpop")
print $1, ($2 > $3)

執行系統命令的方式，可以通過管道的方式，也可以通過system()函數。註意包圍命令的引號加的位置。

awk ‘BEGIN{name="ma long shuai";print (1,2,3,4) | "echo " name}‘
awk ‘BEGIN{while (("fdisk -l" | getline) >0){print $0}}‘
awk ‘BEGIN{system("fdisk -l")}‘
awk ‘BEGIN{name="ma long shuai";system("echo " name)}‘

printf命令可以輸出更格式化的數據。

printf(format, value1, value2, ... , valueN)

format是一個字符串，包含按字面輸出的純文本，還包含輸出格式，格式使用格式說明符"%"描述，後面跟著幾個字符，這些字符控制一個value的輸出格式。第一個"%"描述value1的輸出格式，第二個"%"描述value2的輸出格式，依次類推。因此，"%"的數量應該和被輸出的value數量一樣多。

例如：

{ printf("total pay for %s is $%.2f\n", $1, $2 * $3) }
{ printf("%-8s $%6.2f\n", $1, $2 * $3) }

第一個程序包含了兩個要格式化的value，分別是"$1"和"$2 * $3"。這兩個value的輸出格式分別被"%s"和"%.2f"描述，前者表示按字符串格式輸出"$1"，後者表示按小數值格式輸出"$2 * $3"，且小數位占2位。由於printf不自帶尾隨換行符，因此手動加一個換行符"\n"。

第二個程序，"%-8s"表示"$1"按字符串格式輸出，但短橫線"-"表示要左對齊輸出，"8"表示占用8個字符寬度，不足之數在右邊空格補齊。"%6.2f"表示按小數格式輸出"$2 * $3"，且小數位占用2位，總字符數占用6位。註意，小數點也占用一個字符寬度。因此，一個可能的輸出值為"123.20"。

格式說明符"%"後可跟以下幾個常見字符：

格式符：
- %d,%i：十進制整數；
- %f：顯示浮點數；
- %s：顯示字符串；
- %u：無符號整數；
- %%：顯示%自身。
修飾符：
- N：顯示寬度；N為數值，寬度不足時若為左對齊則右邊空格補足，若右對齊則左邊空格補足。
- -：左對齊；
- +：顯示數值正負號。
- 0：表示以0填充。

3.輸入行的字段分隔符和行分隔符

使用"-F"選項或設置內置變量"FS"可以控制輸入行的字段分隔符，默認分隔符為" "。可通過正則表達式指定分隔符，其實可以認為總是以正則方式指定分隔符。

以下是幾個示例和需要註意的空格分隔符：

-F " "：默認的，會壓縮所有前導空白，包括制表符和空格。
-F " :":當空格後跟一個冒號時作為分隔符。會壓縮前導空格，但不會匹配制表符，更不會壓縮制表符。
-F "[ ]‘：只表示一個空格，不壓縮任何空白。
-F "|"：指定豎線作為分隔符。
-F ",[ \t]*|[ \t]+"：逗號後跟0或多個空白，或者只有1或多個空白時作為分隔符。

也就是說，當空格寫在最前面且不被中括號包圍限制的時候，總會忽略前導空格，但不一定能匹配制表符。

使用內置變量"RS"可以控制輸入行的行分隔符，默認為"\n"，只有遇到行分隔符時才作為"一行"記錄被讀取。

將其讀作行分隔符不標準，應該讀為"記錄分隔符"。例如設置以制表符作為記錄分隔符。

RS="\t"

記錄分隔符變量"RS"只識別第一個字符，若設置為"\t\t"，則第二個"\t"被忽略。但是控制輸出記錄分隔符的內置變量OFS則可識別多字符。

可通過設置FS="\n";RS=""使得awk能處理多行記錄。但此時，原本的每行數據整體變成一個字段。

4.BGEIN和END

BEGIN和END是一個特殊的PATTERN，BEGIN引導的程序是在awk讀取第一個文件第一行前要執行的awk程序，END引導的程序是在awk處理完最後一個文件最後一行後要執行的awk程序。通常BEGIN用於輸出一個標題，或者初始化一些格式、變量等，END則用於最後的總結性輸出。

所以awk稍微完整一點的格式為：

BGEIN{ACTIONS}PATTERN{ACTIONS}END{ACTIONS}

刨去BEGIN和END引導的兩個程序，中間處理輸入文件的程序PATTER{ACTIONS}稱為"主輸入循環(main input loop)"。在進入主輸入循環之前，可以不用提供輸入流，但進入主輸入循環後，必須提供輸入流。

例如，在開始處理文件前，設置輸出報表的頭部，在最後輸出總共輸出了多少行。其中print ""表示輸出一個空行。

BEGIN{print "ID NAME GENDER GENDER";print ""}{print $0}END{print "total num: " NR}

5.數組

awk的數組和shell的數組類似，都支持數值index的普通數組和字符串index的關聯數組，其實數值index仍然會轉換成字符串格式的index，所以awk的數組類型都是關聯數組。

數組格式：array_name[index]
數值賦值：array_name[1]=value1
引用數組：array_name[1]

需要註意的是，關聯數組的index必須使用雙引號包圍，例如array_name["ma"]，如果寫成array_name[ma]，則表示使用變量"ma"的值作為index。若"ma"變量未定義，則這會定義一個新的數組array_name[""]。

使用index in array_name的方式可以判斷數組array_name中是否有index下標對應的數組元素。如果有，它會返回1，否則返回0。所以判斷語句可以如下：

if ( "ma" in array_name )

其實，判斷某個數組變量的值是否為空也可判斷該數組元素是否存在，如下。但這有副作用，當該元素不存在時，會創建它。

if ( array_name["ma"] != "" )

for循環的一種變體：

for (i in array_name){
    do something about array_name[i]
}

可以用於變量數組，其中變量"i"是變量數組時的index，array_name是數組名。這是以遍歷index的方式遍歷數組。由於index的順序隨機，所以遍歷時順序也是隨機的。當然，遍歷數組的方式有多種，以上只是for循環遍歷的一種方式。

使用delete語句可以刪除數組中的元素或者刪除整個數組。如下：

delete array_name["ma"]  # 刪除array_name中下標為ma的元素
delete array_name        # 刪除數組array_name

6.流程控制語句

在ACTION中，可以使用流程控制語句。包括但不限於：

if (expression) statements
if (expression) statements else statements
while (expression) statements
for (expression; expression; expression) statements
for (expression in array) statements
do statements while (expression)

還有幾個能影響循環的動作：

break：退出循環。
continue：退出當前循環，進入下一個循環
next：讀入下一行，並awk程序的頂端從頭開始。這個awk程序是PATTERN{action}這部分，不包括BEGIN{action}。
exit code：直接進入END，若本就在END中，則直接退出awk。如果END中的exit沒有定義code，則采用前一個exit的code。

6.1 條件判斷語句

if格式：

PATTERN {
  if (test_cmd){
      cmd1
      cmd2
      ...
  }
}

if-else格式為：

PATTERN {
   if (test_cmd){
      cmd1
      cmd2
      ......
      }
   else
      cmd3
}

當if或else結構中的命令只有一個，則其內可省大括號，如果超過一個，則需要使用大括號。

若采用一行書寫格式，則如下：

PATTERN {if (test_cmd){cmd1;cmd2;...}else {cmd3;cmd4...}}

還有if-else if-else格式。

PATTERN {
    if (test_cmd){cmd_list1}
    else if {cmd_list2}
    else if {cmd_list3}
    else {cmd_list}
}

還支持多目操作符。

expression ? action1 : action2

其中"?"和":"還可以繼續嵌套。

6.2 while循環

結構：

PATTERN {
  cmd1
  while (test_cmd)
      cmd
}

當cmd有多個時，使用大括號包圍。

PATTERN {
    cmd1
    while (test_cmd){
        cmd2
        cmd3
        ....
    }
}

一行書寫格式：

PATTERN{cmd1;while (test_cmd){cmd1;cmd2}}

6.3 do循環

和while循環類似，地位和shell中的until循環一樣。都是至少執行一次命令列表。

結構：

PATTERN {
    do{
        cmd1
        cmd2
    } while (test_cmd)
}

6.4 for循環

結構大致如下：

PATTERN {
    for (i=1;i<=10;++i){
    cmd1
    cmd2
    }
}

for後括號中包括：變量初始值，條件判斷和計數器增長表達式。

7.更完整的awk程序格式和表達式

更完整的awk程序的語法格式有以下幾種：

BEGIN{actions}
END{actions}
expr{actions}
/regexp/{actions}：可被regexp匹配的行才執行actions
expr1,expr2{actions}：表示範圍，從滿足expr1的行開始，到滿足expr2的行結束

其中：

expr是表達式。
- 比較操作符有：< <= == != >= > ~ !~。
- 算術操作符有：+ - * / % ^(取冪) **(取冪)。其中**非POSIX標準，不可移植。
- 賦值操作符有：++ -- += -= *= /= %= ^= **=。awk支持復合賦值，例如FS = OFS = "\t"表示字段分隔符和輸出字段分隔符都被賦值為制表符。
/regexp/為正則匹配模式，表示該行能被regexp匹配則為真。還有以下兩種匹配表達式，分別表示給定的字符串能(不能)匹配就為真。
- string ~ /regexp/
- string !~ /regexp/
還有符合模式的表達式。使用邏輯操作符"&&"、"||"和"!"連接。如$4 == "Asia" && $3 > 500，! (NR > 1 && NF > 3)。

awk中字符串和數值數據類型是自動轉換的。如果想要得到一個字符串值，可以value ""進行轉換，同理，如果想要得到一個數值，可以value + 0。

另外，正則表達式可以不用包圍在兩個斜杠中。可以將正則表達式賦值給一個變量，然後使用該變量取匹配數據。例如：

reg="^[0-9]+$"
$2 ~ reg

甚至直接使用雙引號替換斜杠也允許。但不建議使用，因為一個元字符可能需要多個反斜杠來保護，使得看上去極其晦澀。

8.awk中的變量

普通變量：給變量賦值時，如果要賦值字符串，則該字符串應該使用雙引號包圍，特別是包含特殊字符時。賦值數值時無所謂。字段變量：$1,$2,$3,...,$NF，還有"$0"表示整行內容。另外，可以直接賦值一個新字段或修改字段值。但這都會影響"$0"。同理，修改"$0"也會影響各字段值。
內置變量：其實可以分為兩類，一類是awk內部自動修改的變量，如行數變量NR，一類是內部不會改動的系統變量，如輸入字段分隔符變量FS，完全需要手動修改，這類一般都有默認值。

ARGV：命令行參數數組。從0開始計數知道ARGC-1。
ARGC：ARGV數組元素的個數。
FILENAME：當前處理的文件名。
FNR：當前處理文件的記錄號。(file record num)
NR：已處理的總記錄數。多個文件時不重置。(record num)
NF：當前記錄的字段總數。(field num)
FS：輸入的字段分隔符。默認為空白。(file separate)
OFS：輸出的字段分隔符。默認為空白。(output record separate)
RS：輸入流的記錄分隔符。默認為"\n"。該變量只取值第一個字符。(record separate)
ORS：輸出流的記錄分隔符。默認為"\n"。該變量只取值的第一個字符。(output record separate)
OFMT：printf輸出數值轉換成字符串輸出時的格式。默認為"%.6g"。
CONVFMT：printf輸出數值轉換成字符串輸出時的格式。會被OFMT覆蓋。默認為"%.6g"。
RLENGTH：被match函數匹配的字符串的長度。
RSTART：被match函數匹配的字符串的開始位置。
SUBSEP：下標分隔符。默認為"\034"，ASCII中034代表的是雙引號‘"‘。

註意，像NR、FNR、RS等的對象是記錄(record)，而非行。只有當RS="\n"時，讀取了一行才表示讀取了一條記錄。

9.awk中的內置函數

awk有兩類內置函數：算術函數和字符串函數。還支持自定義函數。

算術函數：

cos(x)：取x的余弦。
sin(x)：取x的正弦。
sqrt(x)：取x的平方根。
rand()：返回一個隨機數r，其中0<=r<1。
srand(x)：設置rand()的種子值為x。種子值相同時，rand()的結果相同。可print srand()輸出當前種子值。
int(x)：取x的整數部分。

因此，要生成一個範圍[1,n]的隨機數，使用int(n*rand() + 1)，要四舍五入一個數值，使用int(x + 0.5)。

隨機數的種子值相同時，rand的結果總是相同。如下兩次運行結果，兩次結果中，前兩個rand()值相同，後兩個rand()值不同，因為中間使用了srand()重設種子值。

awk ‘BEGIN{print rand();print rand();srand();print rand();print rand();print srand()}‘
  0.237788
  0.291066
  0.109925
  0.983692
  1504560578

awk ‘BEGIN{print rand();print rand();srand();print rand();print rand();print srand()}‘
  0.237788
  0.291066
  0.96322
  0.670495
  1504560604

字符串函數：建議下面的所有regexp都使用"//"包圍。

index(str1,str2)：返回子串str2在字符串str1中第一次出現的位置。如果沒有指定str1，則返回0。
length(str1)：返回字符串str1的長度。如果未給定str1，則表示計算"$0"的長度。
substr(str1,p)：返回str1中從p位置開始的後綴字符串。
substr(str1,p,n)：返回str1中從p位置開始，長度為n的子串。
match(str1,regexp)：如果regexp能匹配str1，則返回匹配起始位置。否則返回0。它會設置內置變量RSTART和RLENGTH的值。
split(str1,array,sep)：使用字段分隔符sep將str1分割到數組array中，並返回數組的元素個數。如果未指定sep則采用FS的值。因此該函數用於切分字段到數組中，下標從1開始。
sprintf(fmt,expr)：根據printf的格式fmt，返回格式化後的expr。
sub(regexp,rep,str2)：將str2中第一個被regexp匹配的字符串替換成rep，替換成功則返回1(表示替換了1次)，否則返回0。註意是貪婪匹配。
sub(regexp,rep)：將"$0"中第一個被regexp匹配的字符串替換成rep，替換成功則返回1，否則返回0。註意是貪婪匹配。
gsub(regexp,rep,str2)：將str2中所有被regexp匹配的內容替換成rep，並返回替換的次數。
gsub(regexp,rep)：將"$0"中所有被regexp匹配的內容替換成rep，並返回替換的次數。
toupper(str)：將str轉換成大寫字母，並返回新串。
tolower(str)：將str轉換成小寫字母，並返回新串。

關於替換函數sub和gsub，可以在替換字符串rep中使用"&"符號表示反向引用，引用的是整個被匹配的部分。

awk ‘BEGIN{
    print index("banana","na")
    print length("banana")
    print match("banana","na.*")
    print toupper("banana")
    print substr("banana",3)}‘ 
3
6
3
BANANA
nana

awk ‘BEGIN{str1="x&x";str2="banana"
        print sub(/a.*n/,str1,str2)
        print str2}‘ 
1
bxananxa

awk ‘BEGIN{
    print match("banana",/a.*n/)
    print RSTART,RLENGTH}‘
2
2 4

awk ‘BEGIN{print sprintf("hello %i world %5s","123","abc")}‘
hello 123 world   abc

awk ‘BEGIN{
    name="Ma long shuai"
    split(name,myname)
    for (i in myname){
        print myname[i]}
    }‘
Ma
long
shuai

縱觀上述字符串函數，沒有一個函數可以將匹配成功的字符串輸出出來。但借助match()和RSTART、RLENGTH可以實現。

例如，取出"Ma:long:shuai"中的"long"並輸出。

awk ‘BEGIN{
    name="Ma:long:shuai"
    if (match(name,/:[^:]*:/)){
        print substr(name,RSTART+1,RLENGTH-2)}}‘
long

10.自定義函數

function name(parameter-list) {
    statements
}

函數中的變量不影響函數外的變量，但可以使用外部變量。參數列表使用逗號分隔，這些參數只在函數內部生效。

可以在awk的引號內任意位置處定義函數(即使是BEGIN之前或END之後)，且函數的調用位置可以在函數的定義位置之前。但註意，函數必須不能定義在BEGIN或主輸入循環或END內部，否則自定義函數的大括號會和包圍action的大括號沖突而報錯。即如下(1)-(4)處位置可定義定義函數，在任意位置處調用函數。

awk ‘(1)BEGIN{ACTIONS}(2)PATTERN{ACTIONS}(3)END{ACTIONS}(4)‘

在函數的statements中，可以使用return expression語句，表示函數的返回值。

例如，創建一個"向字符串指定位置處插入一個字符"的函數。

awk ‘function insert(STRING, POS, INS) {
    before_tmp = substr(STRING, 1, POS)
    after_tmp = substr(STRING, POS + 1)
    return before_tmp INS after_tmp
}
BEGIN{print insert("banana",3,"x")}‘

11.getline函數

getline函數用於從文件、標準輸入或管道中讀取數據，並按情況設置變量的值。getline可以自動不斷的加載下一行。如果能讀取記錄，則getline的返回值為1，遇到輸入流的尾部時，返回值為0，不能讀取記錄(如文件沒有讀取權限、文件不存在)時，返回值為“-1"。

其中：

getline：會從主輸入文件中讀取記錄。會同時設置$0,NF,NR,FNR。
getline var：會從主輸入文件中讀取記錄，並將讀取的記錄賦值給變量var。會同時設置var,NR,FNR。
getline <file：從外部文件file中讀取記錄。同時會設置$0,NF。
getline var <file：從外部文件file中讀取記錄，並將讀取的記錄賦值給變量var。會同時設置var。
cmd | getline：從管道中讀取記錄。會同時設置$0,NF。
cmd | getline var：從管道中讀取記錄，並將讀取的記錄賦值給變量var。會同時設置var。

也就是說：

當getline從非主輸入文件讀取記錄時，不會設置NR和FNR；
當getline後沒有給定變量var時，會將讀取的記錄賦值給$0，於是會同時設置NF並切分成字段；否則將讀取的記錄賦值給變量var，不會設置NF切分字段。

仍然註意，從外部文件file中讀取記錄時，需要使用雙引號包圍文件名，否則被當成awk中的變量。

例如，執行Linux下的who命令並傳遞給getline讀取，每讀取一行記錄，變量n自增1。

while ("who" | getline)
n++

將Linux命令date的結果保存到awk的變量date中。

"date" | getline date

當寫成循環時，如：

while (getline <"file"){
    cmd...
}

這是不安全的，因為當無法讀取file時，返回值為"-1"，而while循環的判斷條件是0和非0，所以"-1"也會進入死循環。所以，安全的寫法為：

while (getline <"file" >0){
    cmd...
}

12.向awk傳遞變量

awk很重要且必備的能力是接受外界的變量，例如shell中的變量，shell中命令執行的結果，或者是在開始執行awk前應該初始化的變量。

例如，在shell中定義一個變量name，傳遞給awk使用。

awk -v awk_name="$name" ‘BEGIN{print awk_name}‘ 
Ma longshuai

有三種方式可以向awk傳遞變量：

1.將待傳遞變量當作文件名被awk解析。awk識別後發現是賦值語句，就認為其是變量傳遞。變量賦值語句必須定義awk program之後。此法定義的變量不可在BEGIN中使用，因為它是被當成文件解析的，只有在需要讀取主輸入文件的時候才會被解析。

awk ‘BEGIN{}PATTERN{print var1,var2,var3}‘ var1=value1 var2=value2 file1 var3=value3 var1=value4 file2

在上面的語句中，當awk執行完BEGIN程序後，準備讀取主輸入，於是開始解析program後的輸入文件。解析時發現，var1和var2都是賦值語句，於是當成變量處理，當讀取到file1時，發現只有一個參數，則當作輸入文件，於是開始處理該文件。在處理file1時，var1和var2都是有效的，但var3還未賦值，因此var3無效。當處理完file1後，繼續解析下一個主輸入文件，此時var3被賦值，並開始處理file2。在處理file2時，var1、var2和var3都是有效的，但var1被新值覆蓋。

此外，還可以將shell命令的結果賦值給這些預定義變量。如下展示了幾種變量定義的方式：

name="Ma longshuai"
awk ‘program‘ OFS=":" var1="$name" var2="`echo Ma longshuai2`" var3="Ma longshuai3" var4=Malongshuai4 filename

不僅可以定義普通變量，還可以定義內置變量(如上OFS)。註意加引號的方式：為了安全，應該對所有賦值語句的value部分加上雙引號，除非所賦的值不包含特殊字符。所以，如果上面的var1賦值語句寫成var1=$name，將被awk解析成var1=Ma longshuai，於是var1的值為Ma，主輸入文件為longshuai。

2.使用"-v"選項傳遞。變量賦值語句必須定義在awk program之前。這種方法定義的變量可以在BEGIN程序中使用。

除了定義在program之前，定義方式同上。每定義一個變量，都需要使用一個"-v"選項。如：

name="Ma longshuai"
awk -v OFS=":" -v var1="$name" -v var2="`echo Ma longshuai2`" -v var3="Ma longshuai3" ‘program‘ filename

3.通過參數數組ARGV的方式。

ARGV是內置的數組變量。awk內部會將命令行切分，並按規則將各參數存放到ARGV數組中，數組下標從0開始，這是awk中唯一下標從0開始的數組。在存放到ARGV時，所有的選項和program會被忽略。

每存儲一個數組變量，特殊變量ARGC的值增加1。因此ARGC的值代表的是參數的個數。所以，數組變量從ARGV[0]到ARGV[ARGC-1]。

可使用類似下面的循環來遍歷ARGV數組。

awk -F "\t" -v var1="value1" ‘BEGIN{
        for(i=0;i<ARGC;++i){
            print "ARGV[" i "]: " ARGV[i]
        }
        print "ARGC: " ARGC
    }‘ "a" "b" "v=1" file 
  ARGV[0]: awk
  ARGV[1]: a
  ARGV[2]: b
  ARGV[3]: v=1
  ARGV[4]: file
  ARGC: 5

註意，ARGV[0]存儲的是awk命令，"-F"和"-v"選項都沒有存儲到ARGV中。

ARGC和ARGV數組變量的值都可以手動修改。命令行分割存儲完成之後，開始處理BEGIN，再處理主循環輸入。因此，在BEGIN中修改ARGV中輸入文件對應的值，可以改變awk所讀取的輸入文件，若將其設置為空，則該數組變量直接被跳過，也就不再讀取該輸入文件。

需要註意的是，當增加ARGV元素時，必須同時遞增ARGC的值，因為awk是根據AGRC來讀取ARGV的。同理，只增加ARGC的值，將導致新建ARGV數組元素，且這些新元素的值為空。也因此，如果減小ARGC的值，將導致無法訪問超出ARGC-1邊界的ARGV元素。

回到系列文章大綱：http://www.cnblogs.com/f-ck-need-u/p/7048359.html

轉載請註明出處：http://www.cnblogs.com/f-ck-need-u/p/7509812.html

註：若您覺得這篇文章還不錯請點擊下右下角的推薦，有了您的支持才能激發作者更大的寫作熱情，非常感謝！

awk知識點全回顧

次數動作正則表達式 pro 新的 n) express 數值轉換建議本文目錄：1.awk簡介和基本語法格式2.print和printf格式化輸出3.輸入行的字段分隔符和行分隔符4.BGEIN和END5.數組6.流程控制語句　　6.1 條件判斷語句　　6.2 whil

awk知識點全回顧

1. awk簡介和基本語法格式

2.print和printf格式化輸出

3.輸入行的字段分隔符和行分隔符

4.BGEIN和END

5.數組

6.流程控制語句

6.1 條件判斷語句

6.2 while循環

6.3 do循環

6.4 for循環

7.更完整的awk程序格式和表達式

8.awk中的變量

9.awk中的內置函數

10.自定義函數

11.getline函數

12.向awk傳遞變量

轉載請註明出處：http://www.cnblogs.com/f-ck-need-u/p/7509812.html

註：若您覺得這篇文章還不錯請點擊下右下角的推薦，有了您的支持才能激發作者更大的寫作熱情，非常感謝！

awk知識點全回顧

優維DevOps系列沙龍全回顧：DevOps+SRE落地實踐+DevOps最後一棒

js面試題知識點全解(一作用域和閉包)

nginx知識點簡單回顧

技術爭鳴！七大主題報告，四大技術專題，AI開發者大會首日議程全回顧

React基礎知識點全解

Spring全回顧之HelloWrold

邏輯地址（段地址，偏移地址）知識點全面回顧

java面試-計算機網路傳輸層知識點全覆蓋

Spring全回顧之Properties屬性賦值

面向物件知識點總結回顧

Java虛擬機器垃圾回收相關知識點全梳理（上）

Java虛擬機器垃圾回收相關知識點全梳理（下）

React零碎知識點回顧

python8之面向對象補充之知識點回顧

java基礎知識點回顧

<python全棧開發基礎>學習過程筆記【6d】列表，字典，元組，知識點復習

java知識點回顧——繼承、重寫、重載、多態

使用html5中video自定義播放器必備知識點總結以及JS全屏API介紹

前期知識點回顧

awk知識點全回顧

1. awk簡介和基本語法格式

2.print和printf格式化輸出

3.輸入行的字段分隔符和行分隔符

4.BGEIN和END

5.數組

6.流程控制語句

6.1 條件判斷語句

6.2 while循環

6.3 do循環

6.4 for循環

7.更完整的awk程序格式和表達式

8.awk中的變量

9.awk中的內置函數

10.自定義函數

11.getline函數

12.向awk傳遞變量

轉載請註明出處：http://www.cnblogs.com/f-ck-need-u/p/7509812.html

註：若您覺得這篇文章還不錯請點擊下右下角的推薦，有了您的支持才能激發作者更大的寫作熱情，非常感謝！

相關推薦