Linux——file命令與magic file
阿新 • • 發佈:2019-02-07
file命令的作用是用於檢驗檔案的型別,並列印至終端。file命令檢驗檔案型別按以下順序來完成:
- 檢驗檔案系統(Filesystem)中支援的檔案型別。
- 檢驗magic file規則。
- 檢驗檔案內容的語言和字符集。
檢驗檔案系統(Filesystem)中支援的檔案型別
檔案系統支援的檔案型別指的是通過ls -l中第一個字元表示的檔案型別:- -(regular):正規檔案(包括文字檔案(ASCII)(會列印text),可執行檔案(會列印excutable),其他二進位制檔案(會列印data))
- d(directory):目錄
- l(link):軟連結(不包括硬連線,硬連結會以正規檔案顯示
- b(block buffered special):隨機儲存的裝置檔案,如硬碟,光碟等儲存裝置
- c(character unbuffered special):持續輸入的裝置檔案,如滑鼠,鍵盤
- s(socket):socket檔案,最常在/var/run目錄下看到這類檔案
- p(pipe):管道檔案(first-in-first-out),它的目的在解決多個程式同時存取一個檔案造成的錯誤問題
檢驗magic file規則
magic file是什麼意思呢?magic file指的是那些具有特殊檔案格式的檔案,如C檔案,它會有#include字樣;tar檔案的前幾個位元組會有特殊的規則。而檢驗magic file規則就是根據這些特殊的格式去判斷一個檔案的型別。而這些規則是儲存在$HOME/.magic.mgc,$HOME/.magic,,/etc/magic.mgc,/etc/magic/usr/share/misc/magic.mgc,/usr/share/misc/magic中。*/magic檔案是文字檔案,而*/magic.mgc檔案則是由*/magic編譯後的二進位制檔案。同一目錄下若存在*/magic.mgc則使用該檔案,否則使用*/magic。這些配置的優先順序為$HOME/.magic*>/etc/magic*>/usr/share/misc/magic*。*/magic檔案內容格式
- offset:指定由檔案起始的第幾個byte開始檢驗。
- type:要進行檢驗的資料型別,即由offset那個byte開始的那個資料型別是什麼。具體有哪些資料型別,可以參才magic(5)。常用的資料型別有
byte:一個byte的值
short:兩個byte的值
long:四個byte的值
string:字串。 - test:檢驗值。用於檢驗offset下的type是否是這個test值。使用C語言的數值或字元表示形式。
- message:用於顯示檢驗結果的資訊顯示
想要檢視檔案MIME型別只需要知道4個函式就可以了,
magic_t magic_open(int flags);
int magic_load(magic_t cookie, const char *filename);
void magic_close(magic_t cookie);
const char *magic_file(magic_t cookie, const char *filename);
標頭檔案
- #include <magic.h>
gcc編譯時需要加上-lmagic引數
看函式名稱就一目瞭然,先使用magic_open建立一個magic_t資料結構
再magic_load載入資料庫
此時便可以使用magic_file進行檢測了,使用完成後使用magic_close釋放資源
可以說這是libmagic的使用方式。
想要獲取檔案MIME型別在呼叫magic_open時我們的flags要設定為MAGIC_MIME_TYPE,flags的具體引數可以參考libmagic文件
載入資料庫時我們設定NULL來使用預設的資料庫,預設的資料庫linux一般是/usr/share/misc/magic.mgc,這取決於MAGIC這個系統變數。
下面是一個簡單的示例
- #include <stdio.h>
- #include <magic.h>
- int main(int argc,char **argv)
- {
- magic_t cookie;
- cookie=magic_open(MAGIC_MIME_TYPE);
- magic_load(cookie,NULL);
- puts(magic_file(cookie,argv[1]));
- magic_close(cookie);
- return 0;
- }