1. 程式人生 > 其它 >php大檔案上傳

php大檔案上傳

需求:

支援大檔案批量上傳(20G)和下載,同時需要保證上傳期間使用者電腦不出現卡死等體驗;

內網百兆網路上傳速度為12MB/S

伺服器記憶體佔用低

支援資料夾上傳,資料夾中的檔案數量達到1萬個以上,且包含層級結構。

支援PC端全平臺作業系統,Windows,Linux,Mac

支援檔案和資料夾的批量下載,斷點續傳。重新整理頁面後繼續傳輸。關閉瀏覽器後保留進度資訊。

支援資料夾批量上傳下載,伺服器端保留資料夾層級結構,伺服器端資料夾層級結構與本地相同。

支援斷點續傳,關閉瀏覽器或重新整理瀏覽器後仍然能夠保留進度。

支援資料夾結構管理,支援新建資料夾,支援資料夾目錄導航

互動友好,能夠及時反饋上傳的進度;

服務端的安全性,不因上傳檔案功能導致JVM記憶體溢位影響其他功能使用;

最大限度利用網路上行頻寬,提高上傳速度;

分析:

對於大檔案的處理,無論是使用者端還是服務端,如果一次性進行讀取傳送、接收都是不可取,很容易導致記憶體問題。所以對於大檔案上傳,採用切塊分段上傳

從上傳的效率來看,利用多執行緒併發上傳能夠達到最大效率。

解決方案:

檔案上傳頁面的前端可以選擇使用一些比較好用的上傳元件,例如百度的開源元件WebUploader,澤優軟體的up6,這些元件基本能滿足檔案上傳的一些日常所需功能,如非同步上傳檔案,資料夾,拖拽式上傳,黏貼上傳,上傳進度監控,檔案縮圖,甚至是大檔案斷點續傳,大檔案秒傳。

在web專案中上傳資料夾現在已經成為了一個主流的需求。在OA,或者企業ERP系統中都有類似的需求。上傳資料夾並且保留層級結構能夠對使用者行成很好的引導,使用者使用起來也更方便。能夠提供更高階的應用支撐。

資料庫配置類DBConfig.java

importjava.sql.Connection;

importjava.sql.DriverManager;

importjava.sql.SQLException;

importorg.apache.commons.lang.StringUtils;

importdown2.biz.DnFile;

importdown2.biz.DnFileMySQL;

importdown2.biz.DnFileOracle;

importdown2.biz.DnFileSQL;

/**

*資料庫配置類

*@authorjmzy

*/

publicclassDBConfig{

publicStringm_db="oracle";//sql,oracle,mysql

Stringdriver="";

Stringurl="";

Stringname="";

Stringpass="";

//sql

Stringsql_driver="com.microsoft.sqlserver.jdbc.SQLServerDriver";

Stringsql_url="jdbc:sqlserver://127.0.0.1:1433;DatabaseName=up6";

Stringsql_name="sa";

Stringsql_pass="123456";

//mysql

Stringmysql_driver="com.mysql.jdbc.Driver";

Stringmysql_url="jdbc:mysql://127.0.0.1:3306/up6?user=root&password=123456&characterEncoding=UTF-8";

//oracle資料庫配置

Stringoracle_driver="oracle.jdbc.driver.OracleDriver";

Stringoracle_url="jdbc:oracle:thin:@localhost:1521:orcl";

Stringoracle_name="system";

Stringoracle_pass="123456";

publicDBConfig() {

if(StringUtils.equals(this.m_db,"sql") )

{

this.driver=this.sql_driver;

this.url=this.sql_url;

this.name=this.sql_name;

this.pass=this.sql_pass;

}

elseif(StringUtils.equals(this.m_db,"mysql") )

{

this.driver=this.mysql_driver;

this.url=this.mysql_url;

}

elseif(StringUtils.equals(this.m_db,"oracle") )

{

this.driver=this.oracle_driver;

this.url=this.oracle_url;

this.name=this.oracle_name;

this.pass=this.oracle_pass;

}

}

publicDBFiledb() {

if(StringUtils.equals(this.m_db,"sql") )returnnewDBFileSQL();

elseif(StringUtils.equals(this.m_db,"mysql") )returnnewDBFileMySQL();

elseif(StringUtils.equals(this.m_db,"oracle") )returnnewDBFileOracle();

elsereturnnewDBFile();

}

publicDnFiledown() {

if(StringUtils.equals(this.m_db,"sql") )returnnewDnFileSQL();

elseif(StringUtils.equals(this.m_db,"mysql") )returnnewDnFileMySQL();

elseif(StringUtils.equals(this.m_db,"oracle") )returnnewDnFileOracle();

elsereturnnewDnFile();

}

publicConnection getCon()

{

Connectioncon=null;

try

{

Class.forName(this.driver).newInstance();//載入驅動。

if(StringUtils.equals(this.m_db,"mysql"))con=DriverManager.getConnection(this.url);

elsecon=DriverManager.getConnection(this.url,this.name,this.pass);

}

catch(SQLExceptione)

{

//TODOAuto-generated catch block

e.printStackTrace();

}catch(InstantiationExceptione) {

//TODOAuto-generated catch block

e.printStackTrace();

}catch(IllegalAccessExceptione) {

//TODOAuto-generated catch block

e.printStackTrace();

}catch(ClassNotFoundExceptione) {

//TODOAuto-generated catch block

e.printStackTrace();

}

returncon;

}

}

該專案核心就是檔案分塊上傳。前後端要高度配合,需要雙方約定好一些資料,才能完成大檔案分塊,我們在專案中要重點解決的以下問題。

*如何分片;

*如何合成一個檔案;

*中斷了從哪個分片開始。

如何分,利用強大的js庫,來減輕我們的工作,市場上已經能有關於大檔案分塊的輪子,雖然程式設計師的天性曾迫使我重新造輪子。但是因為時間的關係還有工作的關係,我只能罷休了。最後我選擇了百度的WebUploader來實現前端所需。

如何合,在合之前,我們還得先解決一個問題,我們如何區分分塊所屬那個檔案的。剛開始的時候,我是採用了前端生成了唯一uuid來做檔案的標誌,在每個分片請求上帶上。不過後來在做秒傳的時候我放棄了,採用了Md5來維護分塊和檔案關係。

在服務端合併檔案,和記錄分塊的問題,在這方面其實行業已經給了很好的解決方案了。參考迅雷,你會發現,每次下載中的時候,都會有兩個檔案,一個檔案主體,另外一個就是檔案臨時檔案,臨時檔案儲存著每個分塊對應位元組位的狀態。

這些都是需要前後端密切聯絡才能做好,前端需要根據固定大小對檔案進行分片,並且請求中要帶上分片序號和大小。前端傳送請求順利到達後臺後,伺服器只需要按照請求資料中給的分片序號和每片分塊大小(分片大小是固定且一樣的)算出開始位置,與讀取到的檔案片段資料,寫入檔案即可。

為了便於開發,我 將服務端的業務邏輯進行了如下劃分,分成初始化,塊處理,檔案上傳完畢等。

服務端的業務邏輯模組如下

功能分析:

資料夾生成模組

資料夾上傳完畢後由服務端進行掃描程式碼如下

分塊上傳,分塊處理邏輯應該是最簡單的邏輯了,up6已經將檔案進行了分塊,並且對每個分塊資料進行了標識,這些標識包括檔案塊的索引,大小,偏移,檔案MD5,檔案塊MD5(需要開啟)等資訊,服務端在接收這些資訊後便可以非常方便的進行處理了。比如將塊資料儲存到分散式儲存系統中

分塊上傳可以說是我們整個專案的基礎,像斷點續傳、暫停這些都是需要用到分塊。

分塊這塊相對來說比較簡單。前端是採用了webuploader,分塊等基礎功能已經封裝起來,使用方便。

藉助webUpload提供給我們的檔案API,前端就顯得異常簡單。

前臺HTML模板

分則必合。把大檔案分片了,但是分片了就沒有原本檔案功能,所以我們要把分片合成為原本的檔案。我們只需要把分片按原本位置寫入到檔案中去。因為前面原理那一部我們已經講到了,我們知道分塊大小和分塊序號,我就可以知道該分塊在檔案中的起始位置。所以這裡使用RandomAccessFile是明智的,RandomAccessFile能在檔案裡面前後移動。但是在andomAccessFile的絕大多數功能,已經被JDK1.4的NIO的“記憶體對映檔案(memory-mapped files)”取代了。我在該專案中分別寫了使用RandomAccessFile與MappedByteBuffer來合成檔案。分別對應的方法是uploadFileRandomAccessFile和uploadFileByMappedByteBuffer。兩個方法程式碼如下。

秒傳功能

服務端邏輯

秒傳功能,相信大家都體現過了,網盤上傳的時候,發現上傳的檔案秒傳了。其實原理稍微有研究過的同學應該知道,其實就是檢驗檔案MD5,記錄下上傳到系統的檔案的MD5,在一個檔案上傳前先獲取檔案內容MD5值或者部分取值MD5,然後在匹配系統上的資料。

Breakpoint-http實現秒傳原理,客戶端選擇檔案之後,點選上傳的時候觸發獲取檔案MD5值,獲取MD5後呼叫系統一個介面(/index/checkFileMd5),查詢該MD5是否已經存在(我在該專案中用redis來儲存資料,用檔案MD5值來作key,value是檔案儲存的地址。)介面返回檢查狀態,然後再進行下一步的操作。相信大家看程式碼就能明白了。

嗯,前端的MD5取值也是用了webuploader自帶的功能,這還是個不錯的工具。

控制元件計算完檔案MD5後會觸發md5_complete事件,並傳值md5,開發者只需要處理這個事件即可,

斷點續傳

up6已經自動對斷點續傳進行了處理,不需要開發都再進行單獨的處理。

在f_post.jsp中接收這些引數,並進行處理,開發者只需要關注業務邏輯,不需要關注其它的方面。

斷點續傳,就是在檔案上傳的過程中發生了中斷,人為因素(暫停)或者不可抗力(斷網或者網路差)導致了檔案上傳到一半失敗了。然後在環境恢復的時候,重新上傳該檔案,而不至於是從新開始上傳的。

前面也已經講過,斷點續傳的功能是基於分塊上傳來實現的,把一個大檔案分成很多個小塊,服務端能夠把每個上傳成功的分塊都落地下來,客戶端在上傳檔案開始時呼叫介面快速驗證,條件選擇跳過某個分塊。

實現原理,就是在每個檔案上傳前,就獲取到檔案MD5取值,在上傳檔案前呼叫介面(/index/checkFileMd5,沒錯也是秒傳的檢驗介面)如果獲取的檔案狀態是未完成,則返回所有的還沒上傳的分塊的編號,然後前端進行條件篩算出哪些沒上傳的分塊,然後進行上傳。

當接收到檔案塊後就可以直接寫入到伺服器的檔案中

這是資料夾上傳完後的效果

這是資料夾上傳完後在服務端的儲存結構

參考文章:java http大檔案斷點續傳上傳 – 澤優軟體部落格