1. 程式人生 > >java判斷檔案的真實型別

java判斷檔案的真實型別

在檔案傳輸過程中,為了安全驗證,對於手工改動檔案字尾名產生的偽造檔案進行判斷過濾。

比如,我們需要的是excel檔案,如果不加驗證內容,將一些可執行的檔案通過更改字尾傳輸給你,就是一個很大的漏洞了。

java判斷檔案真實型別依靠的是檔案的頭部編碼資訊,具體程式碼如下:

<span style="font-size:12px;">package com.zhuifeng.util.excel;

import java.io.FileInputStream;
import java.io.IOException;
import java.util.HashMap;

/**
 * @author guoxk
 * 
 * @version 建立時間 2016年7月17日 上午10:47:26
 * 
 * 類描述:獲取和判斷檔案頭資訊 
 *    |--檔案頭是位於檔案開頭的一段承擔一定任務的資料,一般都在開頭的部分。
 *    |--標頭檔案作為一種包含功能函式、資料介面宣告的載體檔案,用於儲存程式的宣告(declaration),而定義檔案用於儲存程式的實現(implementation)。
 *    |--為了解決在使用者上傳檔案的時候在伺服器端判斷檔案型別的問題,故用獲取檔案頭的方式,直接讀取檔案的前幾個位元組,來判斷上傳檔案是否符合格式。
 * 
 */
public class CheckExcelFileTypeUtil {
	// 快取檔案頭資訊-檔案頭資訊
	public static final HashMap<String, String> mFileTypes = new HashMap<String, String>();
	static {
		// images
		mFileTypes.put("FFD8FF", "jpg");
		mFileTypes.put("89504E47", "png");
		mFileTypes.put("47494638", "gif");
		mFileTypes.put("49492A00", "tif");
		mFileTypes.put("424D", "bmp");
		//
		mFileTypes.put("41433130", "dwg"); // CAD
		mFileTypes.put("38425053", "psd");
		mFileTypes.put("7B5C727466", "rtf"); // 日記本
		mFileTypes.put("3C3F786D6C", "xml");
		mFileTypes.put("68746D6C3E", "html");
		mFileTypes.put("44656C69766572792D646174653A", "eml"); // 郵件
		mFileTypes.put("D0CF11E0", "doc");
		mFileTypes.put("D0CF11E0", "xls");//excel2003版本檔案
		mFileTypes.put("5374616E64617264204A", "mdb");
		mFileTypes.put("252150532D41646F6265", "ps");
		mFileTypes.put("255044462D312E", "pdf");
		mFileTypes.put("504B0304", "docx");
		mFileTypes.put("504B0304", "xlsx");//excel2007以上版本檔案
		mFileTypes.put("52617221", "rar");
		mFileTypes.put("57415645", "wav");
		mFileTypes.put("41564920", "avi");
		mFileTypes.put("2E524D46", "rm");
		mFileTypes.put("000001BA", "mpg");
		mFileTypes.put("000001B3", "mpg");
		mFileTypes.put("6D6F6F76", "mov");
		mFileTypes.put("3026B2758E66CF11", "asf");
		mFileTypes.put("4D546864", "mid");
		mFileTypes.put("1F8B08", "gz");
	}

	/**
	 * @author guoxk
	 *
	 * 方法描述:根據檔案路徑獲取檔案頭資訊
	 * @param filePath 檔案路徑
	 * @return 檔案頭資訊
	 */
	public static String getFileType(String filePath) {
//		System.out.println(getFileHeader(filePath));
//		System.out.println(mFileTypes.get(getFileHeader(filePath)));
		return mFileTypes.get(getFileHeader(filePath));
	}

	/**
	 * @author guoxk
	 *
	 * 方法描述:根據檔案路徑獲取檔案頭資訊
	 * @param filePath 檔案路徑
	 * @return 檔案頭資訊
	 */
	public static String getFileHeader(String filePath) {
		FileInputStream is = null;
		String value = null;
		try {
			is = new FileInputStream(filePath);
			byte[] b = new byte[4];
			/*
			 * int read() 從此輸入流中讀取一個數據位元組。int read(byte[] b) 從此輸入流中將最多 b.length
			 * 個位元組的資料讀入一個 byte 陣列中。 int read(byte[] b, int off, int len)
			 * 從此輸入流中將最多 len 個位元組的資料讀入一個 byte 陣列中。
			 */
			is.read(b, 0, b.length);
			value = bytesToHexString(b);
		} catch (Exception e) {
		} finally {
			if (null != is) {
				try {
					is.close();
				} catch (IOException e) {
				}
			}
		}
		return value;
	}

	/**
	 * @author guoxk
	 *
	 * 方法描述:將要讀取檔案頭資訊的檔案的byte陣列轉換成string型別表示
	 * @param src 要讀取檔案頭資訊的檔案的byte陣列
	 * @return   檔案頭資訊
	 */
	private static String bytesToHexString(byte[] src) {
		StringBuilder builder = new StringBuilder();
		if (src == null || src.length <= 0) {
			return null;
		}
		String hv;
		for (int i = 0; i < src.length; i++) {
			// 以十六進位制(基數 16)無符號整數形式返回一個整數引數的字串表示形式,並轉換為大寫
			hv = Integer.toHexString(src[i] & 0xFF).toUpperCase();
			if (hv.length() < 2) {
				builder.append(0);
			}
			builder.append(hv);
		}
//		System.out.println(builder.toString());
		return builder.toString();
	}
	/**
	 * @author guoxk
	 *
	 * 方法描述:測試
	 * @param args
	 * @throws Exception
	 */
	public static void main(String[] args) throws Exception {
		final String fileType = getFileType("E:\\補貼名單.xls");
		System.out.println(fileType);
	}</span><span style="font-family: Arial, Helvetica, sans-serif;"></span><pre name="code" class="java"><span style="font-size:12px;">}</span>