[轉]根據檔案頭資料判斷檔案型別
現有一檔案,其副檔名未知或標記錯誤。假設它是一個正常的、非空的檔案,且將副檔名更正後可以正常使用,那麼,如何判斷它是哪種型別的檔案?
在後綴未知,或者字尾被修改的檔案,依然通過檔案頭來判斷該檔案究竟是什麼檔案型別。我們可以使用一個文字編輯工具如UltraEdit開啟檔案(16進位制模式下),然後看檔案頭是什麼字元,以下是常見檔案型別的檔案頭字元(16進位制),希望對你有幫助:
JPEG (jpg),檔案頭:FFD8FF
PNG (png),檔案頭:89504E47
GIF (gif),檔案頭:47494638
TIFF (tif),檔案頭:49492A00
Windows Bitmap (bmp),檔案頭:424D
CAD (dwg),檔案頭:41433130
Adobe Photoshop (psd),檔案頭:38425053
Rich Text Format (rtf),檔案頭:7B5C727466
XML (xml),檔案頭:3C3F786D6C
HTML (html),檔案頭:68746D6C3E
Email [thorough only] (eml),檔案頭:44656C69766572792D646174653A
Outlook Express (dbx),檔案頭:CFAD12FEC5FD746F
Outlook (pst),檔案頭:2142444E
MS Word/Excel (xls.or.doc),檔案頭:D0CF11E0
MS Access (mdb),檔案頭:5374616E64617264204A
WordPerfect (wpd),檔案頭:FF575043
Postscript (eps.or.ps),檔案頭:252150532D41646F6265
Adobe Acrobat (pdf),檔案頭:255044462D312E
Quicken (qdf),檔案頭:AC9EBD8F
Windows Password (pwl),檔案頭:E3828596
ZIP Archive (zip),檔案頭:504B0304
RAR Archive (rar),檔案頭:52617221
Wave (wav),檔案頭:57415645
AVI (avi),檔案頭:41564920
Real Audio (ram),檔案頭:2E7261FD
Real Media (rm),檔案頭:2E524D46
MPEG (mpg),檔案頭:000001BA
MPEG (mpg),檔案頭:000001B3
Quicktime (mov),檔案頭:6D6F6F76
Windows Media (asf),檔案頭:3026B2758E66CF11
MIDI (mid),檔案頭:4D546864
下面在提供一個網上使用java寫的根據標頭檔案碼判斷檔案型別
package com;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.IOException;import java.util.Date;import java.util.HashMap;import java.util.Iterator;import java.util.Map;import java.util.Set;public class FileType { public final staticMap<String, String> FILE_TYPE_MAP = new HashMap<String, String>(); private FileType(){} static{ getAllFileType(); //初始化檔案型別資訊 } /** * Discription:[getAllFileType,常見檔案頭資訊] */ private static void getAllFileType() { FILE_TYPE_MAP.put("ffd8ffe000104a464946", "jpg"); //JPEG (jpg) FILE_TYPE_MAP.put("89504e470d0a1a0a0000", "png"); //PNG (png) FILE_TYPE_MAP.put("47494638396126026f01", "gif"); //GIF (gif) FILE_TYPE_MAP.put("49492a00227105008037", "tif"); //TIFF (tif) FILE_TYPE_MAP.put("424d228c010000000000", "bmp"); //16色點陣圖(bmp) FILE_TYPE_MAP.put("424d8240090000000000", "bmp"); //24位點陣圖(bmp) FILE_TYPE_MAP.put("424d8e1b030000000000", "bmp"); //256色點陣圖(bmp) FILE_TYPE_MAP.put("41433130313500000000", "dwg"); //CAD (dwg) FILE_TYPE_MAP.put("3c21444f435459504520", "html"); //HTML (html) FILE_TYPE_MAP.put("3c21646f637479706520", "htm"); //HTM (htm) FILE_TYPE_MAP.put("48544d4c207b0d0a0942", "css"); //css FILE_TYPE_MAP.put("696b2e71623d696b2e71", "js"); //js FILE_TYPE_MAP.put("7b5c727466315c616e73", "rtf"); //Rich Text Format (rtf) FILE_TYPE_MAP.put("38425053000100000000", "psd"); //Photoshop (psd) FILE_TYPE_MAP.put("46726f6d3a203d3f6762", "eml"); //Email [Outlook Express 6] (eml) FILE_TYPE_MAP.put("d0cf11e0a1b11ae10000", "doc"); //MS Excel 注意:word、msi 和 excel的檔案頭一樣 FILE_TYPE_MAP.put("d0cf11e0a1b11ae10000", "vsd"); //Visio 繪圖 FILE_TYPE_MAP.put("5374616E64617264204A", "mdb"); //MS Access (mdb) FILE_TYPE_MAP.put("252150532D41646F6265", "ps"); FILE_TYPE_MAP.put("255044462d312e350d0a", "pdf"); //Adobe Acrobat (pdf) FILE_TYPE_MAP.put("2e524d46000000120001", "rmvb"); //rmvb/rm相同 FILE_TYPE_MAP.put("464c5601050000000900", "flv"); //flv與f4v相同 FILE_TYPE_MAP.put("00000020667479706d70", "mp4"); FILE_TYPE_MAP.put("49443303000000002176", "mp3"); FILE_TYPE_MAP.put("000001ba210001000180", "mpg"); // FILE_TYPE_MAP.put("3026b2758e66cf11a6d9", "wmv"); //wmv與asf相同 FILE_TYPE_MAP.put("52494646e27807005741", "wav"); //Wave (wav) FILE_TYPE_MAP.put("52494646d07d60074156", "avi"); FILE_TYPE_MAP.put("4d546864000000060001", "mid"); //MIDI (mid) FILE_TYPE_MAP.put("504b0304140000000800", "zip"); FILE_TYPE_MAP.put("526172211a0700cf9073", "rar"); FILE_TYPE_MAP.put("235468697320636f6e66", "ini"); FILE_TYPE_MAP.put("504b03040a0000000000", "jar"); FILE_TYPE_MAP.put("4d5a9000030000000400", "exe");//可執行檔案 FILE_TYPE_MAP.put("3c25402070616765206c", "jsp");//jsp檔案 FILE_TYPE_MAP.put("4d616e69666573742d56", "mf");//MF檔案 FILE_TYPE_MAP.put("3c3f786d6c2076657273", "xml");//xml檔案 FILE_TYPE_MAP.put("494e5345525420494e54", "sql");//xml檔案 FILE_TYPE_MAP.put("7061636b616765207765", "java");//java檔案 FILE_TYPE_MAP.put("406563686f206f66660d", "bat");//bat檔案 FILE_TYPE_MAP.put("1f8b0800000000000000", "gz");//gz檔案 FILE_TYPE_MAP.put("6c6f67346a2e726f6f74", "properties");//bat檔案 FILE_TYPE_MAP.put("cafebabe0000002e0041", "class");//bat檔案 FILE_TYPE_MAP.put("49545346030000006000", "chm");//bat檔案 FILE_TYPE_MAP.put("04000000010000001300", "mxp");//bat檔案 FILE_TYPE_MAP.put("504b0304140006000800", "docx");//docx檔案 FILE_TYPE_MAP.put("d0cf11e0a1b11ae10000", "wps");//WPS文字wps、表格et、演示dps都是一樣的 FILE_TYPE_MAP.put("6431303a637265617465", "torrent"); FILE_TYPE_MAP.put("6D6F6F76", "mov"); //Quicktime (mov) FILE_TYPE_MAP.put("FF575043", "wpd"); //WordPerfect (wpd) FILE_TYPE_MAP.put("CFAD12FEC5FD746F", "dbx"); //Outlook Express (dbx) FILE_TYPE_MAP.put("2142444E", "pst"); //Outlook (pst) FILE_TYPE_MAP.put("AC9EBD8F", "qdf"); //Quicken (qdf) FILE_TYPE_MAP.put("E3828596", "pwl"); //Windows Password (pwl) FILE_TYPE_MAP.put("2E7261FD", "ram"); //Real Audio (ram) } /** * 得到上傳檔案的檔案頭 * @param src * @return */ public static String bytesToHexString(byte[] src) { StringBuilder stringBuilder = new StringBuilder(); if (src == null || src.length <= 0) { return null; } for (int i = 0; i < src.length; i++) { int v = src[i] & 0xFF; String hv = Integer.toHexString(v); if (hv.length() < 2) { stringBuilder.append(0); } stringBuilder.append(hv); } return stringBuilder.toString(); } /** * 根據制定檔案的檔案頭判斷其檔案型別 * @param filePaht * @return */ public static String getFileType(String filePaht){ String res = null; try { FileInputStream is = new FileInputStream(filePaht); byte[] b = new byte[10]; is.read(b, 0, b.length); String fileCode = bytesToHexString(b); System.out.println(fileCode); //這種方法在字典的頭程式碼不夠位數的時候可以用但是速度相對慢一點 Iterator<String> keyIter = FILE_TYPE_MAP.keySet().iterator(); while(keyIter.hasNext()){ String key = keyIter.next(); if(key.toLowerCase().startsWith(fileCode.toLowerCase()) || fileCode.toLowerCase().startsWith(key.toLowerCase())){ res = FILE_TYPE_MAP.get(key); break; } } } catch (FileNotFoundException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } return res; } public static void main(String[] args) throws Exception { String type = getFileType("C:/test/eee.WMV"); System.out.println("eee.WMV : "+type); System.out.println(); type = getFileType("C:/test/350996.wav"); System.out.println("350996.wav : "+type); System.out.println(); }}
出處:http://blog.csdn.net/songylwq/article/details/6139753
---------------------
作者:jack_Meng
來源:CNBLOGS
原文:https://www.cnblogs.com/mq0036/p/3912355.html
版權宣告:本文為作者原創文章,轉載請附上博文連結!