PHP sdk文件處理常用程式碼示例解析
主要是:ppt檔案轉為pdf檔案,pdf檔案轉圖片(png)。
描述一下需求:上傳PPT或者PDF檔案到七牛,最終轉換為圖片。檔案上傳部分的功能已經講過了,這裡說一下轉換處理的部分。
文件型別
因為七牛整個的檔案儲存系統中檔案型別並不靠後綴來區分,而是有它自己的 檔案型別(mineType),所以在堆bucket中的資源進行處理的時候,首先要判斷minetype。
多次的測試結果表明,pdf檔案上傳後的minetype一為application/pdf,而ppt上傳後的型別就比較多了,通過jssdk上傳,以及直接在七牛上傳,上傳字尾為ppt、pptx的結果都有可能不一樣。最終總結出如下的幾種型別:
application/vnd.openxmlformats-officedocument.presentationml.presentation
application/zip
application/vnd.ms-powerpoint
application/ppt
application/x-ole-storage
這裡的文件型別判斷PHP-SDK已經提供了,是BucketManager這個類。
//使用方式
$bucketManager = new BucketManager($this->getAuth());//getAuth()方法見七牛php-sdk使用-檔案上傳
$mineTypeInfo = $bucketManager->stat(bucketName,七牛資源名);$mimeType = $mineTypeInfo[0]['mimeType'];
持久化處理
七牛的服務都是通過http請求附加不同的引數來實現的,比如我們處理剪裁一張圖片,或者獲取視訊某一秒的截圖,在我們的頁面中可以直接使用src=http://qiniu.com.cn?xxx這種方式,就能得到我們想要結果,但有的時候我們需要把處理的結果儲存到我們的bucket中,這個就是持久化處理了。
根據sdk封裝一個持久化處理的方法,用到的sdk類為PersistentFop:
/** * 檔案持久化處理 * @param $key 七牛資源名 * @param $pfop 對資源進行的資料處理操作的命令 * @param $bucket bucketName * @return persistentId */ public function persistentOps($key,$bucket,$pfop,$notifyUrl='',$check=true) { header('Access-Control-Allow-Origin:*'); $auth = $this->getAuth(); $persistOps = new PersistentFop($auth,$this->qiniu_image_pipeline,$notifyUrl); list($id,$error) = $persistOps->execute($key,$pfop); if($check){ //可暫時忽略,用來檢查資源持久化處理狀態 $result = $this->checkStatus($id,$persistOps); }else{ $result = true; } return $result; }
PPT轉PDF
使用到的持久化出來命令為:$pfop[] = 'yifangyun_preview/v2|saveas/'.$key;,這裡使用的是七牛的第三方文件轉換服務,因為七牛之前的odconv/pdf已經不再更新維護了,而且出現過轉為pdf排版出現遮擋以及亂碼等問題,所以改為使用億方雲的服務。
這裡面saveas,即儲存為一個新的資源,$key需要做一下說明,按照七牛的要求必須是:
$key = \Qiniu\base64_urlSafeEncode(bucketName.':'.$sourceName);
如果不按照規則進行encode,無法儲存成功。base64_urlSafeEncode,sdk functions.php中已經存在。
有了原始的key,saveas的key,以及pfop持久化處理命令,就可以呼叫persistentOps方法了:
$result = $this->persistentOps($sourceName,$bucketName,$pfop);
pfop可以是一個數組,包含多個處理命令。
PDF轉圖片PNG
因為沒有PPT轉圖片這條路,所以只能先轉PDF。
用到的pfop命令:
odconv/png/page/頁碼/density/150/quality/80|saveas/'.$key;
引數包括頁碼,質量,畫素密度等,還有更多的引數可以查閱文件。所以這裡我們首先要獲取PDF文件的總頁數。使用到的介面命令是:
//odconv/png/info
$url = 'http://'.$this->qiniu_image_domain.'/'.$sourceName.'.pdf?odconv/png/info';
//url部分就是七牛資源可以訪問的完整連結,?後面就是要用到的命令
使用curl去請求這個連結,會返回json資料,裡面會包含page_num成員。
有了page_num,就可以構造pfop陣列了。
public function pdf2PngPfop($page,$sourceName) { $pfop = []; $pngName = $sourceName;//原圖 for($i=1;$i<=$page;$i++){ $randName = $pngName.'_'.$i.'.png';//原圖 $key = \Qiniu\base64_urlSafeEncode($this->bucket_for_image.':'.$randName); $pfop[] = 'odconv/png/page/'.$i.'/density/150/quality/80|saveas/'.$key; } return $pfop; }
然後呼叫:
$res = $this->persistentOps($sourceName.'.pdf',$this->bucket_for_image,'',false);
note:在處理比較大的文件,例如一個PPT有100多頁,那PHP執行等待七牛的結果返回再進行資料的儲存就可能會超時,一個解決方案,是指定回撥url,persistentOps的倒數第二個引數就是回撥url,當文件轉換完成的時候,七牛會向這個地址發起一個請求,後續的圖片連結儲存操作我們交給回撥來做。
tips: 如果對每個pfop命令都指定回撥地址,對我們的(普通)業務伺服器也會造成些許的請求壓力,所以我的做法是給最後一頁的PDF轉圖片命令添加回調url。
回撥地址函式
public function actionQiniuCallback() { $notifyBody = file_get_contents('php://input'); $notifyBodyArray = json_decode($notifyBody,true); $topicId = Yii::$app->request->get('topicId'); $totalPage = Yii::$app->request->get('totalPage');//pdf頁數 $key = $notifyBodyArray['inputKey'];//這個是pdf檔案的key //業務程式碼 ... }
總結
php來做這個文件轉換七牛七牛遇到的一個主要問題就是超時的問題,所以我們可以把轉換的過程拆解,在資料庫中儲存處理狀態,然後用定時任務來自動處理。
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。