Lucene 入門和簡單封裝

阿新 • • 發佈：2019-01-03

package com.whf.demo;

import java.io.IOException;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.locks.Lock;
import java.util.concurrent.locks.ReentrantLock;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import 
 org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.queryparser.classic.MultiFieldQueryParser;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.store.Directory;
import 
 org.apache.lucene.store.LockObtainFailedException;
import org.apache.lucene.util.Version;

/**
 * document(包含多個Field) Field(一個屬性) Analyzer(分詞處理) IndexWriter(建立索引)
 * Directory(索引的儲存的位置,FSDirectory和RAMDirectory) Term(String field->String
 * 待檢索的關鍵詞)
 * 
 * @author whf
 * 
 */
public class LuceneManager 
 {

    private volatile static LuceneManager singleton = null;
    private volatile static IndexWriter writer = null;
    private volatile static IndexReader reader = null;
    private volatile static IndexSearcher searcher = null;

    private final Lock writerLock = new ReentrantLock();
    private final static Object obj = new Object();
    private static Version version = Version.LUCENE_CURRENT;

    /**
     * 單例建構函式
     * 
     * @return
     */
    private LuceneManager() {
    }

    /**
     * 獲取LuceneTools單例例項（obj同步）
     * 
     * @return
     */
    public static LuceneManager getInstance() {
        if (null == singleton) {
            synchronized (obj) {
                if (null == singleton) {
                    singleton = new LuceneManager();
                }
            }
        }
        return singleton;
    }

    /**
     * 獲取IndexWriter單例例項（writerLock同步） 寫單例
     * 
     * @param dir
     * @param config
     * @return
     */
    public IndexWriter getIndexWriter(Directory dir, IndexWriterConfig config) {
        if (dir == null)
            throw new IllegalArgumentException("Directory can not be null.");
        if (config == null)
            throw new IllegalArgumentException(
                    "IndexWriterConfig can not be null.");
        try {
            writerLock.lock();
            if (writer == null) {
                if (IndexWriter.isLocked(dir)) {
                    throw new LockObtainFailedException(
                            "Directory of index had been locked.");
                }
                writer = new IndexWriter(dir, config);
            }
        } catch (LockObtainFailedException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            writerLock.unlock();
        }
        return writer;
    }

    /**
     * 獲取IndexReader物件 寫多例
     * 
     * @param dir
     * @param enableNRTReader
     *            是否開啟NRTReader
     * @return
     */
    public IndexReader getIndexReader(Directory dir, boolean enableNRTReader) {
        if (dir == null)
            throw new IllegalArgumentException("Directory can not be null.");
        try {
            if (reader == null) {
                reader = DirectoryReader.open(dir);
            } else {
                if (enableNRTReader && reader instanceof DirectoryReader) {
                    // 開啟近實時Reader,能立即看到動態新增/刪除的索引變化
                    reader = DirectoryReader
                            .openIfChanged((DirectoryReader) reader);
                }
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
        return reader;
    }

    /**
     * 獲取IndexReader物件(預設不啟用NETReader)
     * 
     * @param dir
     * @return
     */
    public IndexReader getIndexReader(Directory dir) {
        return getIndexReader(dir, false);
    }

    /**
     * 獲取IndexSearcher物件
     * 
     * @param reader
     *            IndexReader物件例項
     * @param executor
     *            如果你需要開啟多執行緒查詢，請提供ExecutorService物件引數
     * @return
     */
    public IndexSearcher getIndexSearcher(IndexReader reader,
            ExecutorService executor) {
        if (reader == null)
            throw new IllegalArgumentException(
                    "The indexReader can not be null.");
        if (searcher == null)
            searcher = new IndexSearcher(reader);
        return searcher;
    }

    /**
     * 獲取IndexSearcher物件(不支援多執行緒查詢)
     * 
     * @param reader
     *            IndexReader物件例項
     * @return
     */
    public IndexSearcher getIndexSearcher(IndexReader reader) {
        return getIndexSearcher(reader, null);
    }

    /**
     * 建立QueryParser物件 QueryParser parser=new QueryParser("欄位名稱","分析器例項"); Query
     * q=parser.parse("關鍵詞");
     * parser.setDefaultOperator(QueryParser.Opertator.AND);
     * 同時含有多個關鍵字，如果是QueryParser.Opertator.OR表示或者 IndexSearcher searcher=new
     * IndexSearcher(reader); Hits hit=searcher.search(q);
     * 
     * @param field
     * @param analyzer
     * @return
     */
    public static QueryParser createQueryParser(String field, Analyzer analyzer) {
        return new QueryParser(field, analyzer);
    }

    /**
     * 建立QueryParser物件 QueryParser parser=new QueryParser("欄位名稱","分析器例項"); Query
     * q=parser.parse("關鍵詞");
     * parser.setDefaultOperator(QueryParser.Opertator.AND);
     * 同時含有多個關鍵字，如果是QueryParser.Opertator.OR表示或者 IndexSearcher searcher=new
     * IndexSearcher(reader); Hits hit=searcher.search(q);
     * 
     * @param field
     * @param analyzer
     * @return
     */
    public static QueryParser createMultiFieldQueryParser(String[] fields,
            Analyzer analyzer) {
        return new MultiFieldQueryParser(fields, analyzer);
    }

    /**
     * 關閉IndexWriter
     * 
     * @param writer
     */
    public static void closeIndexWriter(IndexWriter writer) {
        if (writer != null) {
            try {
                writer.close();
                writer = null;
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }

    /**
     * 關閉IndexReader
     * 
     * @param reader
     */
    public static void closeIndexReader(IndexReader reader) {
        if (reader != null) {
            try {
                reader.close();
                reader = null;
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }

    /**
     * 關閉IndexReader和IndexWriter
     * 
     * @param reader
     * @param writer
     */
    public static void closeAll(IndexReader reader, IndexWriter writer) {
        closeIndexReader(reader);
        closeIndexWriter(writer);
    }
}

package com.whf.demo;

import java.io.File;
import java.io.IOException;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.ArrayList;
import java.util.Collections;
import java.util.List;
import java.util.Set;
import java.util.concurrent.ExecutorService;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.Field.Store;
import org.apache.lucene.document.FieldType;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.IndexOptions;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.IndexableField;
import org.apache.lucene.index.Term;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.Filter;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.Sort;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.search.highlight.Formatter;
import org.apache.lucene.search.highlight.Fragmenter;
import org.apache.lucene.search.highlight.Highlighter;
import org.apache.lucene.search.highlight.InvalidTokenOffsetsException;
import org.apache.lucene.search.highlight.QueryScorer;
import org.apache.lucene.search.highlight.Scorer;
import org.apache.lucene.search.highlight.SimpleFragmenter;
import org.apache.lucene.search.highlight.SimpleHTMLFormatter;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.store.RAMDirectory;
import org.apache.lucene.util.Version;
import org.wltea.analyzer.lucene.IKAnalyzer;

import com.whf.pojo.HighlighterParam;
import com.whf.pojo.Page;

public class LuceneUtil {

    private static final LuceneManager manager = LuceneManager.getInstance();
    private static Analyzer analyzer = new IKAnalyzer(true);
    private static Version version = Version.LUCENE_CURRENT;
    private static FSDirectory fsDirectory = null;
    private static RAMDirectory ramDirectory = null;

    /**
     * 開啟索引目錄
     * 
     * @param luceneDir
     * @return
     * @throws IOException
     */
    public static FSDirectory openFSDirectory(String luceneDir) {
        if (fsDirectory == null)
            try {
                File dir = new File(luceneDir);
                if (!dir.exists())
                    dir.mkdirs();
                fsDirectory = FSDirectory.open(Paths.get(luceneDir));
                // 注意：isLocked方法內部會試圖去獲取Lock,
                // 如果獲取到Lock，會關閉它，否則return false表示索引目錄沒有被鎖.
                // 這也就是為什麼unlock方法被從IndexWriter類中移除的原因
                IndexWriter.isLocked(fsDirectory);
            } catch (IOException e) {
                e.printStackTrace();
            }
        return fsDirectory;
    }

    /**
     * 開啟記憶體目錄
     * 
     * @param luceneDir
     * @return
     * @throws IOException
     */
    public static RAMDirectory openRAMDirectory() {
        if (ramDirectory == null)
            return new RAMDirectory();
        else
            return ramDirectory;
    }

    /**
     * 關閉索引目錄並銷燬
     * 
     * @param directory
     * @throws IOException
     */
    public static void closeDirectory(Directory directory) {
        if (directory != null) {
            try {
                directory.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
            directory = null;
        }
    }

    /**
     * 關閉IndexReader
     * 
     * @param reader
     */
    public static void closeIndexReader(IndexReader reader) {
        if (reader != null) {
            try {
                reader.close();
                reader = null;
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }

    /**
     * 關閉IndexWriter
     * 
     * @param writer
     */
    public static void closeIndexWriter(IndexWriter writer) {
        if (writer != null) {
            try {
                writer.close();
                writer = null;
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }

    /**
     * 關閉IndexReader和IndexWriter
     * 
     * @param reader
     * @param writer
     */
    public static void closeAll(IndexReader reader, IndexWriter writer) {
        closeIndexReader(reader);
        closeIndexWriter(writer);
    }

    /**
     * 獲取IndexWriter
     * 
     * @param dir
     * @param config
     * @return
     */
    public static IndexWriter getIndexWrtier(Directory dir,
            IndexWriterConfig config) {
        return manager.getIndexWriter(dir, config);
    }

    /**
     * 獲取IndexWriter
     * 
     * @param dir
     * @param config
     * @return
     */
    public static IndexWriter getIndexWrtier(String directoryPath,
            IndexWriterConfig config) {
        FSDirectory directory = openFSDirectory(directoryPath);
        return manager.getIndexWriter(directory, config);
    }

    /**
     * 獲取IndexReader
     * 
     * @param dir
     * @param enableNRTReader
     *            是否開啟NRTReader
     * @return
     */
    public static IndexReader getIndexReader(Directory dir,
            boolean enableNRTReader) {
        return manager.getIndexReader(dir, enableNRTReader);
    }

    /**
     * 獲取IndexReader(預設不啟用NRTReader)
     * 
     * @param dir
     * @return
     */
    public static IndexReader getIndexReader(Directory dir) {
        return manager.getIndexReader(dir);
    }

    /**
     * 獲取IndexSearcher
     * 
     * @param reader
     *            IndexReader物件
     * @param executor
     *            如果你需要開啟多執行緒查詢，請提供ExecutorService物件引數
     * @return
     */
    public static IndexSearcher getIndexSearcher(IndexReader reader,
            ExecutorService executor) {
        return manager.getIndexSearcher(reader, executor);
    }

    /**
     * 獲取IndexSearcher(不支援多執行緒查詢)
     * 
     * @param reader
     *            IndexReader物件
     * @return
     */
    public static IndexSearcher getIndexSearcher(IndexReader reader) {
        return manager.getIndexSearcher(reader);
    }

    /**
     * 刪除索引[注意：請自己關閉IndexWriter物件]
     * 
     * @param writer
     * @param field
     * @param value
     */
    public static void deleteIndex(IndexWriter writer, String field,
            String keyword) {
        try {
            writer.deleteDocuments(new Term[] { new Term(field, keyword) });
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    /**
     * 刪除索引[注意：請自己關閉IndexWriter物件]
     * 
     * @param writer
     * @param term
     */
    public static void deleteIndexs(IndexWriter writer, Term[] terms) {
        try {
            writer.deleteDocuments(terms);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    /**
     * 刪除索引[注意：請自己關閉IndexWriter物件]
     * 
     * @param writer
     * @param field
     * @param value
     */
    public static void deleteIndex(IndexWriter writer, Term term) {
        try {
            writer.deleteDocuments(new Term[] { term });
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    /**
     * 批量刪除索引[注意：請自己關閉IndexWriter物件]
     * 
     * @param writer
     * @param querys
     */
    public static void deleteIndexs(IndexWriter writer, Query[] querys) {
        try {
            writer.deleteDocuments(querys);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    /**
     * 刪除索引[注意：請自己關閉IndexWriter物件]
     * 
     * @param writer
     * @param query
     */
    public static void deleteIndex(IndexWriter writer, Query query) {
        try {
            writer.deleteDocuments(query);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    /**
     * 刪除所有索引文件
     * 
     * @param writer
     */
    public static void deleteAllIndex(IndexWriter writer) {
        try {
            writer.deleteAll();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    /**
     * Term term = new Term("id","1234567");
     * 先去索引檔案裡查詢id為1234567的Doc,如果有就更新它(如果有多條，最後更新後只有一條)。如果沒有就新增.
     * 資料庫更新的時候，我們可以只針對某個列來更新，而lucene只能針對一行資料更新。
     * 
     * @param writer
     * @param term
     * @param document
     */
    public static void updateIndex(IndexWriter writer, Term term,
            Document document) {
        try {
            writer.updateDocument(term, document);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    /**
     * 新增索引文件
     * 
     * @param writer
     * @param doc
     */
    public static void addIndex(IndexWriter writer, Document document) {
        updateIndex(writer, null, document);
        // writer.addDocument(document);
    }

    /**
     * 批量新增索引文件
     * 
     * @param writer
     * @param doc
     */
    public static void addIndex(IndexWriter writer, List<Document> documents) {
        try {
            writer.addDocuments(documents);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    /**
     * 將記憶體的資料寫至外存
     * 
     * @param writer
     * @param ramDirectory
     * @param fsramDirectory
     * @param analyzer
     */
    public static void OptimizeRAMToFSDirectory(IndexWriter writer,
            Directory fsDirectory, Analyzer analyzer) {
        try {
            writer.addIndexes(new Directory[] { fsDirectory });
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    /**
     * 索引文件查詢
     * 
     * @param searcher
     * @param query
     * @param sort
     * @return
     */
    public static List<Document> query(IndexSearcher searcher, Query query,
            Integer rows, Sort sort, Filter filter) {
        TopDocs topDocs = null;
        List<Document> docList = null;
        try {
            if (sort != null) {
                if (filter != null) {
                    topDocs = searcher.search(query, filter,
                            (rows == null ? Integer.MAX_VALUE : rows), sort);
                } else {
                    topDocs = searcher.search(query,
                            (rows == null ? Integer.MAX_VALUE : rows), sort);
                }
            } else {
                if (filter != null) {
                    topDocs = searcher.search(query, filter,
                            (rows == null ? Integer.MAX_VALUE : rows));
                } else {
                    topDocs = searcher.search(query,
                            (rows == null ? Integer.MAX_VALUE : rows));
                }
            }
            ScoreDoc[] scores = topDocs.scoreDocs;
            int length = scores.length;
            if (length <= 0) {
                return Collections.emptyList();
            }
            docList = new ArrayList<Document>();
            for (int i = 0; i < length; i++) {
                System.out.println(scores[i].score + " " + scores[i].doc);
                Document doc = searcher.doc(scores[i].doc);
                docList.add(doc);
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
        return docList;
    }

    /**
     * 返回索引文件的總數[注意：請自己手動關閉IndexReader]
     * 
     * @param reader
     * @return
     */
    public static int getIndexTotalCount(IndexReader reader) {
        return reader.numDocs();
    }

    /**
     * 返回索引文件中最大文件ID[注意：請自己手動關閉IndexReader]
     * 
     * @param reader
     * @return
     */
    public static int getMaxDocId(IndexReader reader) {
        return reader.maxDoc();
    }

    /**
     * 返回已經刪除尚未提交的文件總數[注意：請自己手動關閉IndexReader]
     * 
     * @param reader
     * @return
     */
    public static int getDeletedDocNum(IndexReader reader) {
        return getMaxDocId(reader) - getIndexTotalCount(reader);
    }

    /**
     * 根據docId查詢索引文件
     * 
     * @param reader
     *            IndexReader物件
     * @param docID
     *            documentId
     * @param fieldsToLoad
     *            需要返回的field
     * @return
     */
    public static Document findDocumentByDocId(IndexReader reader, int docID,
            Set<String> fieldsToLoad) {
        try {
            return reader.document(docID, fieldsToLoad);
        } catch (IOException e) {
            return null;
        }
    }

    /**
     * 根據docId查詢索引文件
     * 
     * @param reader
     *            IndexReader物件
     * @param docID
     *            documentId
     * @return
     */
    public static Document findDocumentByDocId(IndexReader reader, int docID) {
        return findDocumentByDocId(reader, docID, null);
    }

    /**
     * @Title: createHighlighter
     * @Description: 建立高亮器
     * @param query
     *            索引查詢物件
     * @param prefix
     *            高亮字首字串
     * @param stuffix
     *            高亮字尾字串
     * @param fragmenterLength
     *            摘要最大長度
     * @return
     */
    public static Highlighter createHighlighter(Query query, String prefix,
            String stuffix, int fragmenterLength) {
        Formatter formatter = new SimpleHTMLFormatter((prefix == null || prefix
                .trim().length() == 0) ? "<font color=\"red\">" : prefix,
                (stuffix == null || stuffix.trim().length() == 0) ? "</font>"
                        : stuffix);
        Scorer fragmentScorer = new QueryScorer(query);
        Highlighter highlighter = new Highlighter(formatter, fragmentScorer);
        Fragmenter fragmenter = new SimpleFragmenter(fragmenterLength <= 0 ? 50
                : fragmenterLength);
        highlighter.setTextFragmenter(fragmenter);
        return highlighter;
    }

    /**
     * @Title: highlight
     * @Description: 生成高亮文字
     * @param document
     *            索引文件物件
     * @param highlighter
     *            高亮器
     * @param analyzer
     *            索引分詞器
     * @param field
     *            高亮欄位
     * @return
     * @throws IOException
     * @throws InvalidTokenOffsetsException
     */
    public static String highlight(Document document, Highlighter highlighter,
            Analyzer analyzer, String field) throws IOException {
        List<IndexableField> list = document.getFields();
        for (IndexableField fieldable : list) {
            String fieldValue = fieldable.stringValue();
            if (fieldable.name().equals(field)) {
                try {
                    fieldValue = highlighter.getBestFragment(analyzer, field,
                            fieldValue);
                } catch (InvalidTokenOffsetsException e) {
                    fieldValue = fieldable.stringValue();
                }
                return (fieldValue == null || fieldValue.trim().length() == 0) ? fieldable
                        .stringValue() : fieldValue;
            }
        }
        return null;
    }

    /**
     * @Title: searchTotalRecord
     * @Description: 獲取符合條件的總記錄數
     * @param query
     * @return
     * @throws IOException
     */
    public static int searchTotalRecord(IndexSearcher search, Query query) {
        ScoreDoc[] docs = null;
        try {
            TopDocs topDocs = search.search(query, Integer.MAX_VALUE);
            if (topDocs == null || topDocs.scoreDocs == null
                    || topDocs.scoreDocs.length == 0) {
                return 0;
            }
            docs = topDocs.scoreDocs;
        } catch (IOException e) {
            e.printStackTrace();
        }
        return docs.length;
    }

    /**
     * @Title: pageQuery
     * @Description: Lucene分頁查詢
     * @param searcher
     * @param query
     * @param page
     * @throws IOException
     */
    public static void pageQuery(IndexSearcher searcher, Directory directory,
            Query query, Page<Document> page) {
        int totalRecord = searchTotalRecord(searcher, query);
        // 設定總記錄數
        page.setTotalRecord(totalRecord);
        TopDocs topDocs = null;
        try {
            topDocs = searcher.searchAfter(page.getAfterDoc(), query,
                    page.getPageSize());
        } catch (IOException e) {
            e.printStackTrace();
        }
        List<Document> docList = new ArrayList<Document>();
        ScoreDoc[] docs = topDocs.scoreDocs;
        int index = 0;
        for (ScoreDoc scoreDoc : docs) {
            int docID = scoreDoc.doc;
            Document document = null;
            try {
                document = searcher.doc(docID);
            } catch (IOException e) {
                e.printStackTrace();
            }
            if (index == docs.length - 1) {
                page.setAfterDoc(scoreDoc);
                page.setAfterDocId(docID);
            }
            docList.add(document);
            index++;
        }
        page.setItems(docList);
        closeIndexReader(searcher.getIndexReader());
    }

    /**
     * @Title: pageQuery
     * @Description: 分頁查詢[如果設定了高亮,則會更新索引文件]
     * @param searcher
     * @param directory
     * @param query
     * @param page
     * @param highlighterParam
     * @param writerConfig
     * @throws IOException
     */
    public static void pageQuery(IndexSearcher searcher, Directory directory,
            Query query, Page<Document> page,
            HighlighterParam highlighterParam, IndexWriterConfig writerConfig)
            throws IOException {
        IndexWriter writer = null;
        // 若未設定高亮
        if (null == highlighterParam || !highlighterParam.isHighlight()) {
            pageQuery(searcher, directory, query, page);
        } else {
            int totalRecord = searchTotalRecord(searcher, query);
            System.out.println("totalRecord:" + totalRecord);
            // 設定總記錄數
            page.setTotalRecord(totalRecord);
            TopDocs topDocs = searcher.searchAfter(page.getAfterDoc(), query,
                    page.getPageSize());
            List<Document> docList = new ArrayList<Document>();
            ScoreDoc[] docs = topDocs.scoreDocs;
            int index = 0;
            writer = getIndexWrtier(directory, writerConfig);
            for (ScoreDoc scoreDoc : docs) {
                int docID = scoreDoc.doc;
                Document document = searcher.doc(docID);
                String content = document.get(highlighterParam.getFieldName());
                if (null != content && content.trim().length() > 0) {
                    // 建立高亮器
                    Highlighter highlighter = LuceneUtil.createHighlighter(
                            query, highlighterParam.getPrefix(),
                            highlighterParam.getStuffix(),
                            highlighterParam.getFragmenterLength());
                    String text = highlight(document, highlighter, analyzer,
                            highlighterParam.getFieldName());
                    // 若高亮後跟原始文字不相同，表示高亮成功
                    if (!text.equals(content)) {
                        Document tempdocument = new Document();
                        List<IndexableField> indexableFieldList = document
                                .getFields();
                        if (null != indexableFieldList
                                && indexableFieldList.size() > 0) {
                            for (IndexableField field : indexableFieldList) {
                                if (field.name().equals(
                                        highlighterParam.getFieldName())) {
                                    tempdocument.add(new TextField(
                                            field.name(), text, Store.YES));
                                } else {
                                    tempdocument.add(field);
                                }
                            }
                        }
                        updateIndex(writer,
                                new Term(highlighterParam.getFieldName(),
                                        content), tempdocument);
                        document = tempdocument;
                    }
                }
                if (index == docs.length - 1) {
                    page.setAfterDoc(scoreDoc);
                    page.setAfterDocId(docID);
                }
                docList.add(document);
                index++;
            }
            page.setItems(docList);
        }
        closeIndexReader(searcher.getIndexReader());
        closeIndexWriter(writer);
    }

    /**
     * 建立QueryParser
     * 
     * @return
     */
    public static QueryParser createCustomQueryParser(String field,
            Analyzer analyzer) {
        return manager.createQueryParser(field, analyzer);
    }

    /**
     * 建立多field的QueryParser
     * 
     * @param fields
     * @param analyzer
     * @return
     */
    public static QueryParser createMultiFieldQueryParser(String[] fields,
            Analyzer analyzer) {
        return manager.createMultiFieldQueryParser(fields, analyzer);
    }

    /**
     * 可以在查詢的時候獲取TermVector
     * 
     * @return
     */
    public static Field storeVectorTextField(String name, String value,
            Store store) {
        FieldType type = new FieldType();
        type.setStored(true);
        type.setStoreTermVectors(true);
        type.setIndexOptions(IndexOptions.DOCS_AND_FREQS_AND_POSITIONS_AND_OFFSETS);
        return new Field(name, value, type);
    }

}

package com.whf.pojo;

import java.io.IOException;

import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.LeafReaderContext;
import org.apache.lucene.index.Terms;
import org.apache.lucene.index.TermsEnum;
import org.apache.lucene.queries.CustomScoreProvider;
import org.apache.lucene.queries.CustomScoreQuery;
import org.apache.lucene.search.Query;

public class MyCountQuery extends CustomScoreQuery{

    private String field=null;

    private class MyCountQueryScoreProvider extends CustomScoreProvider{

        private String field=null;

        public MyCountQueryScoreProvider(LeafReaderContext context) {
            super(context);
        }

        public MyCountQueryScoreProvider(LeafReaderContext context, String field) {
            super(context);
            this.field = field;
        }

        @Override
        public float customScore(int arg0, float arg1, float[] arg2)
                throws IOException {
            IndexReader reader = context.reader();
            Terms tv = reader.getTermVector(arg0, field);
            TermsEnum termsEnum = null;
            int numTerms = 0;
            if (tv != null) {
                termsEnum = tv.iterator();
                while ((termsEnum.next()) != null) {
                    numTerms++;
                }
            }
            return (float) (numTerms);
        }

    }

    public MyCountQuery(Query subQuery) {
        super(subQuery);
    }

    public MyCountQuery(Query subQuery, String field) {
        super(subQuery);
        this.field = field;
    }

    @Override
    protected CustomScoreProvider getCustomScoreProvider(
            LeafReaderContext context) throws IOException {
        return new MyCountQueryScoreProvider(context, this.field);
    }

}

package com.whf.pojo;

/**
 * @ClassName: HighlighterParam
 * @Description: 高亮器引數物件
 * @author Lanxiaowei
 * @date 2014-3-30 下午12:22:08
 */
public class HighlighterParam {
    /** 是否需要設定高亮 */
    private boolean highlight;
    /** 需要設定高亮的屬性名 */
    private String fieldName;
    /** 高亮字首 */
    private String prefix;
    /** 高亮字尾 */
    private String stuffix;
    /** 顯示摘要最大長度 */
    private int fragmenterLength;

    public boolean isHighlight() {
        return highlight;
    }

    public void setHighlight(boolean highlight) {
        this.highlight = highlight;
    }

    public String getFieldName() {
        return fieldName;
    }

    public void setFieldName(String fieldName) {
        this.fieldName = fieldName;
    }

    public String getPrefix() {
        return prefix;
    }

    public void setPrefix(String prefix) {
        this.prefix = prefix;
    }

    public String getStuffix() {
        return stuffix;
    }

    public void setStuffix(String stuffix) {
        this.stuffix = stuffix;
    }

    public int getFragmenterLength() {
        return fragmenterLength;
    }

    public void setFragmenterLength(int fragmenterLength) {
        this.fragmenterLength = fragmenterLength;
    }

    public HighlighterParam(boolean highlight, String fieldName, String prefix,
            String stuffix, int fragmenterLength) {
        this.highlight = highlight;
        this.fieldName = fieldName;
        this.prefix = prefix;
        this.stuffix = stuffix;
        this.fragmenterLength = fragmenterLength;
    }

    public HighlighterParam(boolean highlight, String fieldName,
            int fragmenterLength) {
        this.highlight = highlight;
        this.fieldName = fieldName;
        this.fragmenterLength = fragmenterLength;
    }

    public HighlighterParam(boolean highlight, String fieldName, String prefix,
            String stuffix) {
        this.highlight = highlight;
        this.fieldName = fieldName;
        this.prefix = prefix;
        this.stuffix = stuffix;
    }

    public HighlighterParam() {
    }
}

package com.whf.pojo;

import java.io.IOException;

import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.LeafReaderContext;
import org.apache.lucene.index.Terms;
import org.apache.lucene.index.TermsEnum;
import org.apache.lucene.queries.CustomScoreProvider;
import org.apache.lucene.queries.CustomScoreQuery;
import org.apache.lucene.search.Query;

public class MyCountQuery extends CustomScoreQuery{

    private String field=null;

    private class MyCountQueryScoreProvider extends CustomScoreProvider{

        private String field=null;

        public MyCountQueryScoreProvider(LeafReaderContext context) {
            super(context);
        }

        public MyCountQueryScoreProvider(LeafReaderContext context, String field) {
            super(context);
            this.field

 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    Lucene 入門和簡單封裝
      
							
							
							package com.whf.demo;

import java.io.IOException;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.locks.L 

  
 

    

    
    二分入門和簡單進階
       
 
 最近做了不少二分的題，發現二分的運用真的很活，有的時候真的很難發現這是二分。下面是我對於二分的一些典型的題目和進階題目的總結。 
 一、二分的模版 
 分別是我常用的整數二分模版和浮點數二分模版 
 int erfen(){

    int high;

  &nbs 

  
 

    

    
    TypeScript學習——入門和簡單案例
      
                1.簡單介紹

       這裡需要宣告，TypeScript是一個微軟開發的自由的、開源的程式語言，它是JavaScript的一個超集，本質上是向js語言添加了可選的靜態型別和基於類的面向物件程式設計，並不是vue或者某個前端框架特有的工具。

       我們知道，j 

  
 

    

    
    python selenium的使用、檔案下載、登入跳轉問題和簡單封裝
      
							
							
							這幾天折騰selenium，折騰的夠嗆，我們拿窮遊網來舉例吧，起因是因為要下載窮遊網所有的旅遊錦囊，它的檔案是PDF格式的，點選這個按鈕即可下載，但有個前提，它需要登入，於是就拿手機註冊了一個 


起初為了方便，我是打算用phantomjs+selenium這 

  
 

    

    
    AFNetWorking3.0 上傳圖片 和 簡單封裝
      
{
    
    NSString *url = @"";//放上傳圖片的網址
    AFHTTPSessionManager *manager = [AFHTTPSessionManager manager];//初始化請求物件
    manager.responseSerializer = [A 

  
 

    

    
    Vue Vuex和axios的安裝及使用（入門級）axios的簡單封裝
      
							
							
							前言：之所以將Vuex和axios一起講，是因為，請求伺服器之後需要儲存一些全域性狀態，全域性屬性等 
一 、axios的安裝 
執行 → cmd回車 → 進入專案路徑 → 執行以下命令 
npm install axios

二、Vuex的安裝 
執行 → c 

  
 

    

    
    《Python編程從入門到實踐》第二章_變量和簡單數據類型
      數據類型   記錄   strip()   哪些   改變   解決方法   變量名   擔心   cal   什麽是變量呢？
舉例：


>>> message = "Hello,Python!"
>>> print (message)
Hello,Python!


這 

  
 

    

    
    Unreal Engine 4（虛幻UE4）GameplayAbilities 插件入門教程（四）技能屏蔽和簡單的Buff等
      網絡   important   any   time   sim   sed   exe   triggers   進入   本節內容繼續上一節教程的內容（如果沒有看過前面的教程，請前往學習），不會講太難的新東西，而是繼續探究技能標簽（Abiilty Tags）的內容。先來一道開胃菜。
 
第1.1步：
將 

  
 

    

    
    Lucene入門-安裝和運行Demo程序
      height   alt   src   cor   mon   https   docs   必備   hfile   Lucene是什麽    Lucene是一款高性能、可擴展的信息檢索工具庫。— Lucene In ActionLucene版本：7.1一、下載安裝包 https://lucene.apa 

  
 

    

    
    第四十五篇 入門機器學習——數據加載和簡單的數據探索
      com   矩陣   desc   ica   花瓣   入門機器學習   data   類別   機器學習    
 
No.1. 導入相關類庫，並加載鳶尾花數據集

 
No.2. 這個鳶尾花數據集類似於一個字典，可以查看都有哪些鍵

 
No.3. ‘DESCR‘這個鍵對應的值為鳶尾花數據集的文檔，簡單 

  
 

    

    
    Lucene介紹及簡單入門案例（集成ik分詞器）
      chinese   depend   創建索引   圖片   latest   frame   numeric   id字段   div   介紹　　
　　Lucene是apache軟件基金會4 jakarta項目組的一個子項目，是一個開放源代碼的全文檢索引擎工具包，但它不是一個完整的全文檢索引擎，而是一個 

  
 

    

    
    封裝解構，集合，字典，內建函數和簡單選擇排序相關知識及習題
      byte   efault   練習   索引   list()   運算符   sha   pow(x   不存在   封裝
將多個值使用逗號分割，組合在一起本質上，返回一個元組，只是省掉了小括號python特有語法，被很多語言學習和借鑒
解構
把線性結構的元素解開，並順序的賦給其它變量左邊接納的變量數要和 

  
 

    

    
    Lucene筆記23-Lucene的使用-簡單複習索引、檢索和分詞
       
 
 
 一、索引 
 索引過程中的核心類：IndexWriter、Directory、Analyzer、Document、Field。 
 IndexWriter用來寫索引。 
 Directory用來定義索引的目標位置是硬碟上還是記憶體中。 
 Analyzer用來分詞，常用的分詞器有：SimpleA 

  
 

    

    
    Pipenv的入門教程和簡單使用
       
 
  
  
 pipenv 簡要指南 
 pipenv是requests作者的一個專案, 整合了virtualenv, pip, pipfile, 用於更方便地為專案建立虛擬環境並管理虛擬環境中的第三方模組。 
 新建虛擬環境 
 pipenv管理虛擬環境是按專案來的, 要為你的某個專案新建一個虛擬環 

  
 

    

    
    Verilog HDL 初級入門知識簡單講解（wire 和 reg 型別的區別， always 和 assign 的區別，“阻塞”賦值 和 “非阻塞賦值”的區別 ）
       
 
 本文轉載自原作者：姚紀元，原文地址已失效 
        很多剛學Verilog HDL （硬體描述語言）的朋友肯定會對阻塞賦值和非阻塞賦值比較疑惑，那我們就一起來拋開這層迷霧吧。首先我們要理解兩種變數型別 Net Type（連線型）和  

  
 

    

    
    python 程式設計從入門到實踐 第二章 變數和簡單資料型別
       
 
 
  -- 變數 
  
 
  message = "hello python word"
  
 
  print(message)
  
 
  
  
 
  -- 練習 
  
 
  
  
 
  vi simple_message.py
  
 
  #!/usr 

  
 

    

    
    nginx簡單入門和redis+session解決session問題
       
 
 
 nginx是什麼？ 
 nginx高效能的 Web和 反向代理 伺服器，也是一個 IMAP/POP3/SMTP 代理伺服器，IMAP就是internet mail acceess protocol(郵件訪問協議),和POP3的區別是它不需要使用者把所有郵件下載，可以 

  
 

    

    
    Python程式設計:從入門到實踐—變數和簡單資料型別
      變數的命名和使用 
#!/usr/bin/env python# -*- encoding:utf-8 -*- 
message ="Hello Python world!"print(message) 
　　在Python中使用變數時，需要遵守一些規則。 
 
 變數名只能包含字母、數字和下劃線。變數名可以 

  
 

    

    
    Python編程:從入門到實踐—變量和簡單數據類型
      javascrip   may   ref   2.7   info   HERE   script   變量名   結果   變量的命名和使用
#!/usr/bin/env python# -*- encoding:utf-8 -*-
message ="Hello Python world!"print( 

  
 

    

    
    Python編程從入門到實踐筆記——變量和簡單數據類型
      筆記   aid   div   字符   fff   int   color   Once   nbsp    
Python編程從入門到實踐筆記——變量和簡單數據類型

#coding=gbk
#變量
message_1 = ‘aAa fff‘
message_2 = ‘hart‘
message_3 =

Lucene 入門和簡單封裝

Lucene 入門和簡單封裝

二分入門和簡單進階

TypeScript學習——入門和簡單案例

python selenium的使用、檔案下載、登入跳轉問題和簡單封裝

AFNetWorking3.0 上傳圖片和簡單封裝

Vue Vuex和axios的安裝及使用（入門級）axios的簡單封裝

《Python編程從入門到實踐》第二章_變量和簡單數據類型

Unreal Engine 4（虛幻UE4）GameplayAbilities 插件入門教程（四）技能屏蔽和簡單的Buff等

Lucene入門-安裝和運行Demo程序

第四十五篇入門機器學習——數據加載和簡單的數據探索

Lucene介紹及簡單入門案例（集成ik分詞器）

封裝解構，集合，字典，內建函數和簡單選擇排序相關知識及習題

Lucene筆記23-Lucene的使用-簡單複習索引、檢索和分詞

Pipenv的入門教程和簡單使用

Verilog HDL 初級入門知識簡單講解（wire 和 reg 型別的區別， always 和 assign 的區別，“阻塞”賦值和 “非阻塞賦值”的區別）

python 程式設計從入門到實踐第二章變數和簡單資料型別

nginx簡單入門和redis+session解決session問題

Python程式設計:從入門到實踐—變數和簡單資料型別

Python編程:從入門到實踐—變量和簡單數據類型

Python編程從入門到實踐筆記——變量和簡單數據類型