Linux筆記12——檔案內容查閱
檔案內容查閱
如果我們要查閱一個檔案的內容時,該如何是好呢?這裡有相當多有趣的指令可以來分享一下: 最常使用的顯示檔案內容的指令可以說是 cat 與 more 及 less 了!此外,如果我們要檢視一個很大型的檔案 (好幾百MB時),但是我們只需要後端的幾行字而已,那麼該如何是好?呵呵!用 tail 呀,此外, tac 這個指令也可以達到這個目的喔!好了,說說各個指令的用途吧!
cat 由第一行開始顯示檔案內容
tac 從最後一行開始顯示,可以看出 tac 是 cat 的倒著寫!
nl 顯示的時候,順道輸出行號!
more 一頁一頁的顯示檔案內容
less 與 more 類似,但是比 more 更好的是,他可以往前翻頁!
head 只看頭幾行
tail 只看尾巴幾行
od 以二進位制的方式讀取檔案內容!
1,直接檢視檔案內容
直接查閱一個檔案的內容可以使用 cat/tac/nl 這幾個指令啊!
(1)cat (concatenate)
[[email protected] ~]# cat [-AbEnTv]
選項與引數:
-A :相當於 -vET 的整合選項,可列出一些特殊字元而不是空白而已;
-b :列出行號,僅針對非空白行做行號顯示,空白行不標行號!
-E :將結尾的斷行字元 $ 顯示出來;
-n :打印出行號,連同空白行也會有行號,與 -b 的選項不同;
-T :將 [tab] 按鍵以 ^I 顯示出來;
-v :列出一些看不出來的特殊字元
範例一:檢閱 /etc/issue 這個檔案的內容
[[email protected] tmp]# cat /etc/issue
\S
Kernel \r on an \m
範例二:承上題,如果還要加印行號呢?
[[email protected] tmp]# cat -n /etc/issue
1 \S
2 Kernel \r on an \m
3
# 所以這個檔案有三行!看到了吧!可以印出行號呢!這對於大檔案要找某個特定的行時,有點用處!
# 如果不想要編排空白行的行號,可以使用“cat -b /etc/issue”,自己測試看看:
範例三:將 /etc/man_db.conf 的內容完整的顯示出來(包含特殊字元)
[[email protected] tmp]# cat -A /etc/man_db.conf
# $
#$
# This file is used by the man-db package to configure the man and cat paths.$
# 輸出的結果並不會有特殊字型,基本上,在一般的環境中,
# 使用 [tab] 與空白鍵的效果差不多,都是一堆空白啊!我們無法知道兩者的差別。
# 此時使用 cat -A 就能夠發現那些空白的地方是啥鬼東西了![tab]會以 ^I 表示,
# 斷行字元則是以 $ 表示,所以你可以發現每一行後面都是 $ 啊!不過斷行字元
# 在Windows/Linux則不太相同,Windows的斷行字元是 ^M$ 囉。
注意linux的貓指令(cat)可不是貓哦,cat 是 Concatenate (連續) 的簡寫, 主要的功能是將一個檔案的內容連續的印出在螢幕上面!例如上面的例子中,我們將 /etc/issue 印出來!如果加上 -n 或 -b 的話,則每一行前面還會加上行號呦!
當然cat不會那麼常用的啦,一旦超過30、40行,資料那麼多,怎麼看得過來?
(2)tac (反向列示)
[[email protected] tmp]# tac /etc/issue
Kernel \r on an \m
\S
# 嘿嘿!與剛剛上面的範例一比較,是由最後一行先顯示喔!
tac 這個好玩了!怎麼說呢?詳細的看一下, cat 與 tac ,有沒有發現呀!對啦! tac 剛好是
將 cat 反寫過來,所以他的功能就跟 cat 相反啦, cat 是由“第一行到最後一行連續顯示在屏
幕上”,而 tac 則是“ 由最後一行到第一行反向在螢幕上顯示出來 ”,很好玩吧!
(3)nl (新增行號列印)
# nl [-bnw] 檔案
選項與引數:
-b :指定行號指定的方式,主要有兩種:
-b a :表示不論是否為空行,也同樣列出行號(類似 cat -n);
-b t :如果有空行,空的那一行不要列出行號(預設值);
-n :列出行號表示的方法,主要有三種:
-n ln :行號在螢幕的最左方顯示;
-n rn :行號在自己欄位的最右方顯示,且不加 0 ;
-n rz :行號在自己欄位的最右方顯示,且加 0 ;
-w :行號欄位的佔用的字元數。
範例一:用 nl 列出 /etc/issue 的內容
[[email protected] tmp]# nl /etc/issue
1 \S
2 Kernel \r on an \m
# 注意看,這個檔案其實有三行,第三行為空白(沒有任何字元),
# 因為他是空白行,所以 nl 不會加上行號喔!如果確定要加上行號,可以這樣做:
[[email protected] tmp]# nl -b a /etc/issue
1 \S
2 Kernel \r on an \m
3
# 呵呵!行號加上來囉~那麼如果要讓行號前面自動補上 0 呢?可這樣
[[email protected] tmp]# nl -b a -n rz /etc/issue
000001 \S
000002 Kernel \r on an \m
000003
# 嘿嘿!自動在自己欄位的地方補上 0 了~預設欄位是六位數,如果想要改成 3 位數?
[[email protected] tmp]# nl -b a -n rz -w 3 /etc/issue
001 \S
002 Kernel \r on an \m
003
# 變成僅有 3 位數囉~
nl 可以將輸出的檔案內容自動的加上行號!其預設的結果與 cat -n 有點不太一樣, nl 可以將
行號做比較多的顯示設計,包括位數與是否自動補齊 0 等等的功能呢
2,可翻頁檢視
(1)more (一頁一頁翻動)
[[email protected] tmp]# more /etc/man_db.conf
#
#
# This file is used by the man-db package to configure the man and cat paths.
。。。
仔細的給他看到上面的範例,如果 more 後面接的檔案內容行數大於螢幕輸出的行數時, 就會出現類似上面的圖示。重點在最後一行,最後一行會顯示出目前顯示的百分比, 而且還可以在最後一行輸入一些有用的指令喔!在 more 這個程式的執行過程中,你有幾個按鍵可以按的:
空白鍵 (space):代表向下翻一頁;
Enter :代表向下翻“一行”;
/字串 :代表在這個顯示的內容當中,向下搜尋“字串”這個關鍵字;
:f :立刻顯示出檔名以及目前顯示的行數;
q :代表立刻離開 more ,不再顯示該檔案內容。
b 或 [ctrl]-b :代表往回翻頁,不過這動作只對檔案有用,對管線無用。
要離開 more 這個指令的顯示工作,可以按下 q 就能夠離開了。而要向下翻頁,就使用空白鍵即可。 比較有用的是搜尋字串的功能,舉例來說,我們使用“ more /etc/man_db.conf ”來觀察該檔案, 若想要在該檔案內搜尋 MANPATH 這個字串時,可以這樣做:
直接在more的介面裡輸入:
/MANPATH <== 輸入了 / 之後,游標就會自動跑到最下面一行等待輸入!
(2)less (一頁一頁翻動)
[[email protected] ~]# less /etc/man_db.conf
less 的用法比起 more 又更加的有彈性,怎麼說呢?在 more 的時候,我們並沒有辦法向前面翻, 只能往後面看,但若使用了 less 時,呵呵!就可以使用 [pageup] [pagedown] 等按鍵的功能來往前往後翻看檔案,你瞧,是不是更容易使用來觀看一個檔案的內容了呢!除此之外,在 less 裡頭可以擁有更多的“搜尋”功能喔!不止可以向下搜尋,也可以向上搜尋~ 實在是很不錯用~基本上,可以輸入的指令有:
空白鍵 :向下翻動一頁;
[pagedown]:向下翻動一頁;
[pageup] :向上翻動一頁;
/字串 :向下搜尋“字串”的功能;
?字串 :向上搜尋“字串”的功能;
n :重複前一個搜尋 (與 / 或 ? 有關!)
N :反向的重複前一個搜尋 (與 / 或 ? 有關!)
g :前進到這個資料的第一行去;
G :前進到這個資料的最後一行去 (注意大小寫);
q :離開 less 這個程式;
3,資料擷取
通過head、tail可以進行擷取,head 與 tail 都是以“行”為單位來進行資料擷取的喔!
(1)head (取出前面幾行)
head [-n number] 檔案
選項與引數:
-n :後面接數字,代表顯示幾行的意思
[[email protected] ~]# head /etc/man_db.conf
# 預設的情況中,顯示前面十行!若要顯示前 20 行,就得要這樣:
[[email protected] ~]# head -n 20 /etc/man_db.conf
範例:如果後面100行的資料都不列印,只打印/etc/man_db.conf的前面幾行,該如何是好?
[[email protected] ~]# head -n 20 /etc/man_db.conf
head的 -n 選項後面的引數較有趣,如果接的是負數,例如上面範例的-n -100時,代表列前的所有行數, 但不包括後面100行。舉例來說 CentOS 7.1 的 /etc/mandb.conf 共有131行,則上述的指令“head -n -100 /etc/man_db.conf” 就會列出前面31行,後面100行不會打印出來了。這樣說,比較容易懂了吧?
(2)tail (取出後面幾行)
# tail [-n number] 檔案
選項與引數:
-n :後面接數字,代表顯示幾行的意思
-f :表示持續偵測後面所接的檔名,要等到按下[ctrl]-c才會結束tail的偵測
[[email protected] ~]# tail /etc/man_db.conf
# 預設的情況中,顯示最後的十行!若要顯示最後的 20 行,就得要這樣:
[[email protected] ~]# tail -n 20 /etc/man_db.conf
範例一:如果不知道/etc/man_db.conf有幾行,卻只想列出100行以後的資料時?
[[email protected] ~]# tail -n +100 /etc/man_db.conf
範例二:持續偵測/var/log/messages的內容
[[email protected] ~]# tail -f /var/log/messages
<==要等到輸入[crtl]-c之後才會離開tail這個指令的偵測!
其實與head -n -xx有異曲同工之妙。當下達“tail -n +100/etc/man_db.conf” 代表該檔案從100行以後都會被列出來,同樣的,在man_db.conf共有131行,因此第100~131行就會被列出來啦! 前面的99行都不會被顯示出來喔!
例題:假如我想要顯示 /etc/man_db.conf 的第 11 到第 20 行呢?
head -n 20 /etc/man_db.conf | tail -n 10
這兩個指令中間有個管線 (|) 的符號存在,這個管線的意思是:“前面的指令所輸出的訊息,請通過管線交由後續的指令繼續使用”的意思。 所以, head -n 20 /etc/man_db.conf 會將檔案內的 20 行取出來,但不輸出到螢幕上,而是轉交給後續的 tail 指令繼續處理。 因此 tail“不需要接檔名”,因為 tail 所需要的資料是來自於 head 處理後的結果!
例題:承上一題,那如果我想要列出正確的行號呢?就是螢幕上僅列出 /etc/man_db.conf 的第 11 到第 20 行,且有行號存在?答:我們可以通過 cat -n 來帶出行號,然後再通過head/tail 來擷取資料即可!所以就變成如下的模樣了:
[[email protected] ~]# cat -n /etc/man_db.conf | head -n 20 | tail -n 10
(4)非純文字檔案: od
萬一我們想要查閱非文字檔案,舉例來說,例如 /usr/bin/passwd 這個可執行檔案的內容時, 又該如何去讀出資訊呢?事實上,由於可執行檔案通常是 binary file ,使用上頭提到的指令來讀取他的內容時, 確實會產生類似亂碼的資料啊!那怎麼辦?沒關係,我們可以利用 od 這個指令來讀取喔!
od [-t TYPE] 檔案
選項或引數:
-t :後面可以接各種“型別 (TYPE)”的輸出,例如:
a :利用預設的字元來輸出;
c :使用 ASCII 字元來輸出
d[size] :利用十進位制(decimal)來輸出資料,每個整數佔用 size Bytes ;
f[size] :利用浮點數值(floating)來輸出資料,每個數佔用 size Bytes ;
o[size] :利用八進位(octal)來輸出資料,每個整數佔用 size Bytes ;
x[size] :利用十六進位制(hexadecimal)來輸出資料,每個整數佔用 size Bytes ;
範例一:請將/usr/bin/passwd的內容使用ASCII方式來展現!
[[email protected] ~]# od -t c /usr/bin/passwd
0000000 177 E L F 002 001 001 \0 \0 \0 \0 \0 \0 \0 \0 \0
0000020 003 \0 > \0 001 \0 \0 \0 364 3 \0 \0 \0 \0 \0 \0
0000040 @ \0 \0 \0 \0 \0 \0 \0 x e \0 \0 \0 \0 \0 \0
0000060 \0 \0 \0 \0 @ \0 8 \0 \t \0 @ \0 035 \0 034 \0
0000100 006 \0 \0 \0 005 \0 \0 \0 @ \0 \0 \0 \0 \0 \0 \0
.....(後面省略)....
# 最左邊第一欄是以 8 進位來表示Bytes數。以上面範例來說,第二欄0000020代表開頭是
# 第 16 個 byes (2x8) 的內容之意。
範例二:請將/etc/issue這個檔案的內容以8進位列出儲存值與ASCII的對照表
[[email protected] ~]# od -t oCc /etc/issue
0000000 134 123 012 113 145 162 156 145 154 040 134 162 040 157 156 040
\ S \n K e r n e l \ r o n
0000020 141 156 040 134 155 012 012
a n \ m \n \n
0000027
# 如上所示,可以發現每個字元可以對應到的數值為何!要注意的是,該數值是 8 進位喔!
# 例如 S 對應的記錄數值為 123 ,轉成十進位制:1x8^2+2x8+3=83
利用這個指令,可以將 data file 或者是 binary file 的內容資料給他讀出來喔! 雖然讀出的來數值預設是使用非文字檔案,亦即是 16 進位的數值來顯示的, 不過,我們還是可以通過 -t c的選項與引數來將資料內的字元以 ASCII 型別的字元來顯示, 雖然對於一般使用者來說,這個指令的用處可能不大,但是對於工程師來說, 這個指令可以將 binary file 的內容作一個大致的輸出,他們可以看得出東西的啦~ ^_^
如果對純文字檔案使用這個指令,你甚至可以發現到 ASCII 與字元的對照表!非常有趣! 例如上述的範例二,你可以發現到每個英文字 S 對照到的數字都是 123,轉成十進位制你就能夠發現那是 83 囉! 如果你有任何程式語言的書,拿出來對照一下 ASCII 的對照表,就能夠發現真是正確啊!呵呵!
(5)修改檔案時間或建立新檔案: touch
每個檔案在linux下面都會記錄許多的時間引數, 其實是有三個主要的變動時間,那麼三個時間的意義是什麼呢?
modification time (mtime): 當該檔案的“內容資料”變更時,就會更新這個時間!內容資料指的是檔案的內容,而不是檔案的屬性或許可權喔!
status time (ctime): 當該檔案的“狀態 (status)”改變時,就會更新這個時間,舉例來說,像是許可權與屬性被更改了,都會更新這個時間啊。
access time (atime): 當“該檔案的內容被取用”時,就會更新這個讀取時間(access)。舉例來說,我們使用 cat 去讀取 /etc/man_db.conf , 就會更新該檔案的atime 了
[[email protected] ~]# date; ls -l /etc/man_db.conf ; ls -l --time=atime /etc/man_db.conf ; \
> ls -l --time=ctime /etc/man_db.conf # 這兩行其實是同一行喔!用分號隔開
2018年 11月 07日 星期三 23:53:19 CST
-rw-r--r--. 1 root root 5171 6月 10 2014 /etc/man_db.conf
-rw-r--r--. 1 root root 5171 11月 7 23:42 /etc/man_db.conf
-rw-r--r--. 1 root root 5171 9月 17 17:16 /etc/man_db.conf
# 為了要讓資料輸出比較好看,所以將三個指令同時依序執行,三個指令中間用分號 (;) 隔開即可
在預設的情況下,ls 顯示出來的是該檔案的 mtime ,也就是這個檔案的內容上次被更動的時間。 至於系統是在 9月 17 號的時候安裝的,因此,這個檔案被產生導致狀態被更動的時間就回溯到那個時間點了(ctime)! 而還記得剛剛我們使用的範例當中,有使用到man_db.conf這個檔案啊,所以啊,他的 atime 就會變成剛剛使用的時間了!
檔案的時間是很重要的,因為,如果檔案的時間誤判的話,可能會造成某些程式無法順利的執行。 OK!那麼萬一我發現了一個檔案來自未來,該如何讓該檔案的時間變成“現在”的時刻呢? 很簡單啊!就用“touch”這個指令即可!
# touch [-acdmt] 檔案
選項與引數:
-a :僅修訂 access time;
-c :僅修改檔案的時間,若該檔案不存在則不建立新檔案;
-d :後面可以接欲修訂的日期而不用目前的日期,也可以使用 --date="日期或時間"
-m :僅修改 mtime ;
-t :後面可以接欲修訂的時間而不用目前的時間,格式為[YYYYMMDDhhmm]
範例一:新建一個空的檔案並觀察時間
[[email protected] ~]# cd /tmp
[[email protected] tmp]# touch testtouch
[[email protected] tmp]# ls -l testtouch
-rw-r--r-- 1 root root 0 11月 9 15:55 testtouch
# 注意到,這個檔案的大小是 0 呢!在預設的狀態下,如果 touch 後面有接檔案,
# 則該檔案的三個時間 (atime/ctime/mtime) 都會更新為目前的時間。若該檔案不存在,
# 則會主動的建立一個新的空的檔案喔!例如上面這個例子!
範例二:將 ~/.bashrc 複製成為 bashrc,假設複製完全的屬性,檢查其日期
[[email protected] tmp]# cp -a ~/.bashrc bashrc
[[email protected] tmp]# date; ll bashrc; ll --time=atime bashrc; ll --time=ctime bashrc
2018年 11月 09日 星期五 15:56:58 CST
-rw-r--r--. 1 root root 176 12月 29 2013 bashrc <==這是 mtime
-rw-r--r--. 1 root root 176 11月 9 15:54 bashrc <==這是 atime
-rw-r--r--. 1 root root 176 11月 9 15:56 bashrc <==這是 ctime
至於分號“ ; ”則代表連續指令的下達啦!你可以在一行指令當中寫入多重指令, 這些指令可以“依序”執行。由上面的指令我們會知道ll那一行有三個指令被下達在同一行中。
至於執行的結果當中,我們可以發現數據的內容與屬性是被複制過來的,因此檔案內容時間mtime)與原本檔案相同。 但是由於這個檔案是剛剛被建立的,因此狀態(ctime)就變成現在的時間啦!那如果你想要變更這個檔案的時間呢?可以這樣做:
範例三:修改案例二的 bashrc 檔案,將日期調整為兩天前
[[email protected] tmp]# touch -d "2 days ago" bashrc
[[email protected] tmp]# date; ll bashrc; ll --time=atime bashrc; ll --time=ctime bashrc
2018年 11月 09日 星期五 16:19:55 CST
-rw-r--r--. 1 root root 176 11月 7 16:19 bashrc
-rw-r--r--. 1 root root 176 11月 7 16:19 bashrc
-rw-r--r--. 1 root root 176 11月 9 16:19 bashrc
# 跟上個範例比較看看,第一個時間改變了 (atime/mtime)~不過, ctime 並沒有跟著改變喔!
範例四:將上個範例的 bashrc 日期改為 2014/06/15 2:02
[[email protected] tmp]# touch -t 201406150202 bashrc
[[email protected] tmp]# date; ll bashrc; ll --time=atime bashrc; ll --time=ctime bashrc
2018年 11月 09日 星期五 16:24:01 CST
-rw-r--r--. 1 root root 176 6月 15 2014 bashrc
-rw-r--r--. 1 root root 176 6月 15 2014 bashrc
-rw-r--r--. 1 root root 176 11月 9 16:23 bashrc
# 注意看看,日期在 atime 與 mtime 都改變了,但是 ctime 則是記錄目前的時間!
通過 touch 這個指令,我們可以輕易的修訂檔案的日期與時間。並且也可以建立一個空的檔案喔! 不過,要注意的是,即使我們複製一個檔案時,複製所有的屬性,但也沒有辦法複製ctime 這個屬性的。 ctime 可以記錄這個檔案最近的狀態 (status) 被改變的時間。無論如何,還是要告知大家, 我們平時看的檔案屬性中,比較重要的還是屬於那個 mtime 啊!我們關心的常常是這個檔案的“內容” 是什麼時候被更動的說~