jeecms系統附件內容Lucene搜尋——二次開發

阿新 • • 發佈：2019-01-13

1 原有的針對文章的全文檢索方式

1.1文章提交

正常情況下，發表一篇文章時，點選“提交”的時候，如圖：

這裡寫圖片描述：

點選“提交”的時候是將文章所有欄位的資訊提交到後臺，其實就是將這篇文章對應的“內容模型”中的資料都提交到後臺了（“內容模型”的含義可以參考《jeecms系統使用介紹——jeecms中的內容、欄目、模型之間的關係》）。

這個過程比較重要的就是文章內容了，這裡是通過百度的ueditor編輯器編輯了內容，然後將其提交的，這部分內容正文的資料其實是儲存到了表：

jc_content_txt

的“txt”欄位之中，如圖：

這裡寫圖片描述

而其它幾個欄位：

txt1
txt2
txt3

這些欄位中是沒有儲存內容的，它們是附加欄位，預設沒有被使用，留由使用者在二次開發時自行設定。這也為我們處理對附件檔案的全文檢索提供了可能。

文章內容的儲存是在包：

com.jeecms.cms.action.admin.main

裡的類：

ContentAct

@RequiresPermissions("content:o_save")
@RequestMapping("/content/o_save.do")
public String save(Content bean, ContentExt ext, ContentTxt txt,
Boolean copyimg,Integer[] channelIds, Integer[] topicIds,
Integer[] viewGroupIds,
String[] attachmentPaths, String[] attachmentNames,
String[] attachmentFilenames, String[] picPaths, String[] picDescs,
Integer channelId, Integer typeId, String tagStr, Boolean draft,
Integer cid, Integer modelId,Short charge,Double chargeAmount,
Boolean rewardPattern,Double rewardRandomMin,
Double rewardRandomMax,Double[] rewardFix, HttpServletRequest request,HttpServletResponse response, ModelMap model)

1.2 建立索引

文章在“ContentAct”類的“save”方法中儲存過程中，系統會單獨開啟一個執行緒，在類：

com.jeecms.cms.staticpage.ContentStatusChangeThread

裡的方法：

public void run()

中。逐層進入到類：

com.jeecms.cms.lucene.LuceneContent

裡面的方法：

public static Document createDocument(Content c)

在這個方法裡面，會把文章的相關資訊拿出來，包括文章的正文內容，存入Lucene索引裡面去。

2 對文章中上傳的附件進行全文檢索

2.1 實現思路

我們先來說一下實現的思路。有幾點我們是可以確認的：

1，在文章中上傳的附件是儲存在了伺服器的磁碟上，有一個磁碟路徑。
2，文章提交時，所有資訊都會傳給後臺伺服器。
3，後臺伺服器對文章內容有一個儲存的過程。
4，儲存過程中還會再單獨建一個執行緒，用來對文章內容建立索引。

那麼，根據我們的需求，要達到目的，我們完全可以這樣來實現：

1，在文章中上傳的附件時，將上傳到伺服器的附件路徑及檔名稱先在瀏覽器的前臺頁面儲存一下。
2，文章提交時，將附件路徑及名稱也傳遞到後臺伺服器。
3，在後臺伺服器儲存文章內容的過程中，將附件資訊也儲存一下，儲存到資料庫表“jc_content_txt”的欄位“txt1”裡面。這裡相當於使用了“txt1”這個預設欄位。
4，對文章內容建立索引時，除了對文章正文的html內容建立索引，還根據附件路徑及名稱，找到附件檔案並進行讀取，對這些附件的內容建立索引。

2.2 上傳時儲存附件路徑及名稱到文章頁面

編輯文章的頁面在：

{jeecms}/WebRoot/WEB-INF/jeecms_sys/content/add.html

這個頁面，我們在其中加入一個區域，儲存上傳附件的伺服器路徑及其名稱。注意附件上傳並儲存到伺服器之後其名稱就變了，所以需要儲存一下。

這裡寫圖片描述

如圖所示“input”為新加入部分，“value”值會存放內容。每次上傳附件時會將資訊儲存的這個“input”的“value”裡面，那麼還要在上傳操作中加入儲存的方法。

在內容中上傳附件，如圖：

這裡寫圖片描述

點選附件圖示，進入附件上傳介面，如圖：

這裡寫圖片描述

先點選“點選選擇檔案”按鈕，選擇了附件，如圖：

這裡寫圖片描述

然後點選“開始上傳”，這個過程會將檔案上傳到伺服器的磁碟檔案中。點選上傳時的操作在：

{jeecms}/WebRoot/thirdparty/ueditor/dialogs/attachment/attachment.js

中的方法：

uploader.on

裡面，這是百度“ueditor”編輯器，我們做些修改之後內容如下：

這裡寫圖片描述

在原有內容裡，加入了每次上傳時先將所上傳的附件檔案的路徑及名稱儲存到前臺頁面的功能。詳細程式碼如下：

uploader.on('uploadSuccess', function (file, ret) {
var $file = $('#' + file.id);
try {
var responseText = (ret._raw || ret),
json = utils.str2json(responseText);
if (json.state == 'SUCCESS') {
_this.fileList.push(json);
$file.append('<span class="success"></span>');
//alert(file + "----" + ret);
var attachTemp = $("input[name='attachmentsName']", window.parent.document).val();
if( (attachTemp == null) || (attachTemp == "")) {
$("input[name='attachmentsName']", window.parent.document).val(ret.url);
} else {
$("input[name='attachmentsName']", window.parent.document).val(attachTemp + ',' + ret.url);
}
//alert('attachmentsName=' + $("input[name='attachmentsName']", window.parent.document).val());
} else {
$file.find('.error').text(json.state).show();
}
} catch (e) {
$file.find('.error').text(lang.errorServerUpload).show();
}
});

可以把對alert的註釋刪除掉，然後看一下每次記錄的內容。這裡上傳三個檔案，看一下效果：

這裡寫圖片描述

一個doc，一個docx，一個pdf，這3個上傳檔案的伺服器相對路徑及新名稱都得到了。

3 提交文章時將附件路徑傳到後臺

之前已經說了，點選了“提交”按鈕後，後臺對文章內容的儲存是在類：

com.jeecms.cms.action.admin.main.ContentAct

的方法：

public String save

中進行的，然後在對其建立索引。為了能夠對前臺傳過來的附件內容也能建立索引，要對“save”方法加點內容，如下：

這裡寫圖片描述

4 對附件建立索引

萬事俱備，只欠東風。該得到的資訊都得到了，最後我就需要對上傳的附件建立索引了。之前講過建立索引是在類：

com.jeecms.cms.lucene.LuceneContent

裡面的方法：

public static Document createDocument(Content c)

進行的，這裡我們還在這裡面進行。

這裡面有一個預設處理模型項“txt1”的地方，如下：

if (!StringUtils.isBlank(c.getTxt1())) {
doc.add(new Field(CONTENT1, c.getTxt1(), Field.Store.NO,
Field.Index.ANALYZED));
}

我們對它進行修改，在這個區域裡面，將上傳的附件按照型別的不同分別建立索引，內容如下：

if (!StringUtils.isBlank(c.getTxt1())) {
InputStream in = null;
InputStreamReader reader = null;
try {
//讀取txt1中儲存的json串
JSONObject json = new JSONObject(c.getContentTxt().getTxt1());
//讀取json串中儲存的應用伺服器在作業系統上的絕對路徑
String realPath = json.getString("realPath");
//讀取json串中保村的上傳附件的相對路徑及名稱
String attachmentsNameArrays = json.getString("attachmentsNameArrays");
//得到索引檔案陣列
String []arr = attachmentsNameArrays.split(",");
for (int j = 0; j < arr.length; j++) {
//將要搜尋word檔案的地方
String dateDir = realPath + "\\" + arr[j];
//讀取當前這個附件檔案
File file = new File(dateDir);
//輸出這個檔案是第幾個附件
System.out.println("j=" + j);
//輸出這個檔案的路徑及名稱
System.out.println("file=" + file);
//獲取檔名稱
String fileName = file.getName();
//獲取檔案字尾名
String fileType = fileName.substring(fileName.lastIndexOf(".") + 1, fileName.length()).toLowerCase();
//輸出檔名稱
System.out.println("fileName=" + fileName);
//輸出檔名稱
System.out.println("fileType=" + fileType);
//建立當前附件檔案的輸入流
in = new FileInputStream(file);
//在當前附件檔案的字尾名不為空的情況下進行操作，建立索引的檔案包括doc、docx、pdf、txt
if (fileType != null && !fileType.equals("")) {
if (fileType.equals("doc")) {
//建立斌儲存doc檔案索引
//讀取doc檔案
WordExtractor wordData = new WordExtractor(in);
//建立Field物件，並放入lucene的document物件doc中
doc.add(new Field(CONTENT1, wordData.getText(), Field.Store.NO,
Field.Index.ANALYZED));
//輸出當前操作的檔名稱
System.out.println("注意：已為檔案“" + fileName + "”建立了索引");
wordData.close();
} else if ( fileType.equals("docx")) {
//建立斌儲存docx檔案索引
//讀取docx檔案
XWPFWordExtractor wordData = new XWPFWordExtractor(new XWPFDocument(in));
//建立Field物件，並放入lucene的document物件doc中
doc.add(new Field(CONTENT1, wordData.getText(), Field.Store.NO,
Field.Index.ANALYZED));
//輸出當前操作的檔名稱
System.out.println("注意：已為檔案“" + fileName + "”建立了索引");
wordData.close();
}else if ( fileType.equals("pdf")) {
//建立斌儲存pdf檔案索引
//讀取pdf檔案
PDFParser parser = new PDFParser(in);
parser.parse();
PDDocument pdDocument = parser.getPDDocument();
PDFTextStripper stripper = new PDFTextStripper();
// String result = stripper.getText(pdDocument);
//建立Field物件，並放入lucene的document物件doc中
doc.add(new Field(CONTENT1, stripper.getText(pdDocument), Field.Store.NO,
Field.Index.ANALYZED));
//輸出當前操作的檔名稱
System.out.println("注意：已為檔案“" + fileName + "”建立了索引");
pdDocument.close();
} else if ( fileType.equals("txt") ) {
//建立斌儲存txt檔案索引
//讀取txt檔案
//建立一個輸入流物件reader
reader = new InputStreamReader(in);
//建立一個物件，它把檔案內容轉成計算機能讀懂的語言
BufferedReader br = new BufferedReader(reader);
String wordData = "";
String line = null;
//一次讀入一行資料
while ((line = br.readLine()) != null) {
wordData += line;
}
//建立Field物件，並放入lucene的document物件doc中
doc.add(new Field(CONTENT1, wordData, Field.Store.NO,
Field.Index.ANALYZED));
//輸出當前操作的檔名稱
System.out.println("注意：已為檔案“" + fileName + "”建立了索引");
} else {
}
}
}
} catch (JSONException e) {
e.printStackTrace();
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
} finally {
if (in != null) {
try {
in.close();
} catch (IOException e) {
e.printStackTrace();
}
}
if (reader != null) {
try {
reader.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
}

這裡面對doc、docx、pdf、txt幾種型別的檔案分別建立了索引，具體的呼叫方式可以參考《使用Lucene對doc、docx、pdf、txt文件進行全文檢索功能的實現》這篇文章，此處就不贅述了。

5 搜尋

至此，功能事先就完成了。我們新建一篇文章，上傳一個附件進去。然後搜尋一個只在附件中才出現過的內容，進行搜尋。比如新建一篇文章，如圖：

這裡寫圖片描述

裡面上傳了一個附件，內容為：

這裡寫圖片描述

裡面的內容很簡單。現在我們在前臺頁面上搜索“上傳附件”這幾個漢字，比如輸入“使用介紹”，如圖：

這裡寫圖片描述

然後點選鍵盤迴車或滑鼠點選右側的搜尋按鈕，得到搜尋結果如下：

這裡寫圖片描述

能夠看到，文章的正文內容裡直接看是沒有“使用介紹”這幾個字的，但搜尋這幾個字還是把這篇文章搜了出來，說明我們建立的索引生效了。

jeecms系統附件內容Lucene搜尋——二次開發

1 原有的針對文章的全文檢索方式 1.1文章提交正常情況下，發表一篇文章時，點選“提交”的時候，如圖：：點選“提交”的時候是將文章所有欄位的資訊提交到後臺，其實就是將這篇文章對應的“內容模型”中的資料都提交到後臺了（“內容模型”的含義可以參考《jeecms系統

Open-falcon運維監控系統——微信接口二次開發

con 重寫方法接口 ack sets image parse urlopen data 1、Open-falcon運維監控系統簡介 OpenFalcon是一款由小米運維團隊從互聯網公司的需求出發，根據多年的運維經驗，結合市面上使用的一些運維監控系統的使用經驗和反饋，

自開發最新微信雲控系統源碼，可二次開發

roo set failed reac 最新 ffline 命令推送 ica 微信雲控系統是微信群控的升級版。微信群控系統是通過usb線傳輸數據控制手機進行模擬操作的，而微信雲控系統則是通過網絡傳輸數據操作手機端。也就是從服務器下發命令到手機上，手機端執行各種模擬操作。

自開發微信雲控系統源碼，可二次開發

etl usb ted lse net [] message 比較所有微信雲控系統是微信群控的升級版。微信群控系統是通過usb線傳輸數據控制手機進行模擬操作的，而微信雲控系統則是通過網絡傳輸數據操作手機端。也就是從服務器下發命令到手機上，手機端執行各種模擬操作。

超強問卷調查系統源碼購買及二次開發

save handle 技術分享 wrapper -h tro lin 分享圖片思考在學校以及企事業單位裏由於各種調查研究的需要，經常會有各種各樣的調查問卷。在傳統的模式下人們不但要花費不少的時間印刷問卷，而且還要消耗大量的人力物力去發放和回收這些問卷，然後對調查問卷進

呼叫中心系統OA二次開發

清單二次開發工作註意分辨率傳真新增歷史有效 1. 既有修改分辨率顯示自適應調整工作流數據調整 2. 呼叫中心語音電話 l 新建任務字段：任務主題、語音主題、提

Laravel入門及實踐，快速上手社交系統ThinkSNS+二次開發

title 瀏覽器 extend 成了 migration 如果編寫三種 views 【摘要】自從社交系統ThinkSNS+不使用ThinkPHP框架而使用Laravel框架之後，很多人都說技術門檻擡高了，其實你與TS+的距離僅僅只是學習一個新框架而已，所以，我們今天來

（dede）織夢系統二次開發筆記

func 頭條 mem ima lac keywords 引號系統日期（dede）織夢系統二次開發記錄 --soulsjie 一、模板常用文件說明模板文件都在文件夾templets下，我們以默認模板（default）為例，對模板文件結構進行分析：首頁模板文件目錄

微擎二次開發教程之系統目錄結構

上傳定制配置文件附加組 htm 需要數據二次 ins 今天春哥技術博客和大家分享下關於微擎二次開發教程之系統目錄結構，希望可以幫到大家。入口腳本入口腳本是應用啟動流程中的第一環，入口文件根據“系統配置文件”初始化了系統的常量、全局變量及全局對象，並將終端用戶的請

04 用戶個人信息和二次開發django的文件存儲系統

存在引入 tracker 連接 code quest 安裝包 gis ase 用戶的個人信息的前端頁面如下：業務邏輯分析從上圖中可以看出，需要後端傳送的數據有,用戶的名字和練習的地址，和最近的瀏覽記錄。用戶的名字和聯系的地址可以通過地址表（adre

Eclipse二次開發：開啟Eclipse幫助系統

BusyIndicator.showWhile(null, new Runnable() { @Override public void run() { PlatformUI.getWorkbench().getHelpSystem().displayHelpResource("

使用O2OA二次開發搭建企業辦公平臺（十一）組織管理篇：關於系統角色管理

本部落格為O2OA系列教程、O2OA使用手冊，教程目錄和各章節天梯將在連載完後更新。使用O2OA二次開發搭建企業辦公平臺（一）平臺部署篇：平臺下載和部署使用O2OA二次開發搭建企業辦公平臺（二）平臺部署篇：埠衝突和伺服器埠配置使用O2OA二次開發搭建企業辦公平臺（三）平臺部署篇：使用外部資料庫

openstack二次開發：如何定製自己（企業）openstack圖示、標題等內容

問題導讀1.如何修改dasboard網站顏色？2.如何修改openstack dasboard網站標題？3.如何定製自己的logo，及品牌連線？本文定製包含以下內容：網站顏色Logo網站標題站點品牌連結幫助連線Logo和網站顏色1.建立兩個logo檔案，png格式，具有透明背

企業級java b2bc商城系統開源原始碼二次開發-Ribbon負載均衡策略配置

Ribbon作為後端負載均衡器，比Nginx更注重的是承擔併發而不是請求分發，可以直接感知後臺動態變化來指定分發策略。需要JAVA Spring Cloud大型企業分散式微服務雲構建的B2B2C電子商務平臺原始碼請加企鵝求求：二一四七七七五六三三它一共提供了7種負載均衡策略：這裡以隨機訪問策略來舉個

企業級java springcloud b2bc商城系統開源原始碼二次開發-hystrix 請求快取

hystrix支援將一個請求結果快取起來，下一個具有相同key的請求將直接從快取中取出結果，減少請求開銷。要使用該功能必須管理HystrixRequestContext，如果請求B要用到請求A的結果快取，A和B必須同處一個context。通過HystrixRequestContext.ini

二次開發過程中發現一個找也找不到的函式file_delete（），有誰知道這個函式，發現刪除遠端附件函式

反正我沒找到，現在刪除檔案就是unlink，我就是刪除一直false；先測試再說。發現微擎首頁的後臺操作能夠正常刪除新增圖片到七牛雲（刪一張將圖片連結儲存，隨後到七牛雲端儲存->內容管理裡面找，沒找到就是刪了。） ==============

聚播微信客服系統二次開發sdk_微信crm定製開發（持續更新中！）

大家好，我是秋天不穿秋褲，天冷也要風度的程式猿！上次介紹了微信二次開發SDK可開發群控雲控或者微信crm客服系統！現在來看看如何實現服務端對接 1、手機端與服務端通訊採用普通socket 2、pc端與服務端通訊可採用普通socket，也可以使用websocket，具體看公司開發能力！

pc端車牌識別系統二次開發介面

車牌識別SDK是自主研發的車牌識別SDK，在智慧交通系統、出入口管理系統、公安圖幀系統、移動警務系統等多種行業都已實現成功運用。中科慧識車牌識別SDK採用OCR技術，融合了車牌定位、車牌字元切分、車牌字元識別等演算法，使該系統具有識別效率高、速度快、適應性強、使用方便等優勢，技術處於國際先進水平，在相關行業領

超強問卷調查系統原始碼購買及二次開發

在學校以及企事業單位裡由於各種調查研究的需要，經常會有各種各樣的調查問卷。在傳統的模式下人們不但要花費不少的時間印刷問卷，而且還要消耗大量的人力物力去發放和回收這些問卷，然後對調查問卷進行統計分析。由於人工操作調查問卷隨意性較大，容易產生遺漏問題。所以目前大多數的問卷調查都採用基於網頁的線上調查。線上調查

Win10系統下安裝CAA二次開發程式，VS介面上不出現CAA選單欄或選單欄為灰色的

問題描述：Win10系統下安裝了CATIA_CAA V5R19和V4R24兩個版本，其中V5R19版本安裝完成後VS2005中沒有出現CAA選單欄，V5R24安裝完成後VS2008中出現部分整合選單且為灰色不可用。 V5R19採用的VS2005中沒有整合選單問題的解決方法：

jeecms系統附件內容Lucene搜尋——二次開發

1 原有的針對文章的全文檢索方式

1.1文章提交

1.2 建立索引

2 對文章中上傳的附件進行全文檢索

2.1 實現思路

2.2 上傳時儲存附件路徑及名稱到文章頁面

3 提交文章時將附件路徑傳到後臺

4 對附件建立索引

5 搜尋

相關推薦