Elasticsearch之pythonAPI簡單使用

阿新 • • 發佈：2018-05-26

words mat napi PE 補全 pro append 要求 port

elasticsearch自動補全建議功能

數據入庫操作

ESmapping要求

PUT music
{
    "mappings": {
        "_doc" : {
            "properties" : {
                "suggest" : {
                    "type" : "completion"
                },
                "title" : {
                    "type": "keyword"
                }
            }
        }
    }
}

DocType類

from elasticsearch_dsl import DocType, Date, Nested, Boolean,     analyzer, InnerObjectWrapper, Completion, Keyword, Text, Integer

from elasticsearch_dsl.analysis import CustomAnalyzer as _CustomAnalyzer

from elasticsearch_dsl.connections import connections
connections.create_connection(hosts 
=["localhost"])

class CustomAnalyzer(_CustomAnalyzer):
    """
        避免ik_analyzer參數傳遞時會報錯的問題
    """

    def get_analysis_definition(self):
        return {}


ik_analyzer = CustomAnalyzer("ik_max_word", filter=["lowercase"])

class ArticleType(DocType):

    suggest = Completion(analyzer=ik_analyzer)

    ...

Items類

from models.es_types import ArticleType
from elasticsearch_dsl.connections import connections
es = connections.create_connection(ArticleType._doc_type.using)


def gen_suggests(index, info_tuple):
    # 根據字符串生成搜索建議數組
    used_words = set()
    suggests = []
    for text, weight in info_tuple:
        if text:
            # 調用es的analyze接口分析字符串
            words = es.indices.analyze(index=index, analyzer="ik_max_word", params={‘filter‘:["lowercase"]}, body=text)
            anylyzed_words = set([r["token"] for r in words["tokens"] if len(r["token"])>1])
            new_words = anylyzed_words - used_words
        else:
            new_words = set()

        if new_words:
            suggests.append({"input":list(new_words), "weight":weight})


class JobBoleArticleItem(scrapy.Item):

    ...

    def save_to_es(self):
        
        ...

        article.suggest = gen_suggests(ArticleType._doc_type.index, ((article.title,10),(article.tags, 7)))

        article.save()

        redis_cli.incr("jobbole_count")

        return

ES搜索語法

POST myindex/_search?pretty
{
    "suggest": {
        "my-suggest": {
            "text": "linux",
            "completion": {
                "field": "suggest",
                "fuzzy": {
                    "fuzziness": 2
                }
            }
        }
    },
    "_source": ["title"]  
}

自動補全建議核心代碼

# django_views中的寫法

from search.models import ArticleType

class SearchSuggest(View):
    def get(self, request):
        key_words = request.GET.get(‘s‘,‘‘)
        re_datas = []
        if key_words:
            s = ArticleType.search()
            s = s.suggest(‘my_suggest‘, key_words, completion={
                "field":"suggest", "fuzzy":{
                    "fuzziness":2
                },
                "size": 10
            })
            suggestions = s.execute_suggest()
            for match in suggestions.my_suggest[0].options:
                source = match._source
                re_datas.append(source["title"])
        return HttpResponse(json.dumps(re_datas), content_type="application/json")

elasticsearch內容搜索功能

數據入庫操作 　　和上面一樣 搜索核心代碼

# django_views中的寫法

from elasticsearch import Elasticsearch

client = Elasticsearch(hosts=["127.0.0.1"])

class SearchView(View):
    
    def get(self, request):
        key_words = request.GET.get("q","")
        s_type = request.GET.get("s_type", "article")
        page = request.GET.get("p", "1")
        try:
            page = int(page)
        except:
            page = 1

        start_time = datetime.now()
        response = client.search(
            index= "jobbole",
            body={
                "query":{
                    "multi_match":{
                        "query":key_words,
                        "fields":["tags", "title", "content"]
                    }
                },
                "from":(page-1)*10,
                "size":10,
                "highlight": {
                    "pre_tags": [‘<span class="keyWord">‘],
                    "post_tags": [‘</span>‘],
                    "fields": {
                        "title": {},
                        "content": {},
                    }
                }
            }
        )

        end_time = datetime.now()
        last_seconds = (end_time-start_time).total_seconds()
        total_nums = response["hits"]["total"]
        if (page%10) > 0:
            page_nums = int(total_nums/10) +1
        else:
            page_nums = int(total_nums/10)
        hit_list = []
        for hit in response["hits"]["hits"]:
            hit_dict = {}
            if "title" in hit["highlight"]:
                hit_dict["title"] = "".join(hit["highlight"]["title"])
            else:
                hit_dict["title"] = hit["_source"]["title"]
            if "content" in hit["highlight"]:
                hit_dict["content"] = "".join(hit["highlight"]["content"])[:500]
            else:
                hit_dict["content"] = hit["_source"]["content"][:500]

            hit_dict["create_date"] = hit["_source"]["create_date"]
            hit_dict["url"] = hit["_source"]["url"]
            hit_dict["score"] = hit["_score"]

            hit_list.append(hit_dict)

        return render(request, "result.html", {"page":page,
                                            "all_hits":hit_list,
                                            "key_words":key_words,
                                            "total_nums":total_nums,
                                            "page_nums":page_nums,
                                            "last_seconds":last_seconds
                                            })

scrapy框架+django框架組合使用

github項目參考

https://github.com/holgerd77/django-dynamic-scraper

Elasticsearch之pythonAPI簡單使用

words mat napi PE 補全 pro append 要求 port elasticsearch自動補全建議功能數據入庫操作 ESmapping要求 PUT music { "mappings": { "_doc" : {

大資料學習[13]:elasticsearch之簡單的python API

很多時間需要通過python來操作ES，在這裡記錄一個基本的方法。 1. 簡單的python API查詢 # coding=utf-8 from elasticsearch import Elasticsearch es = Elasticsear

android AIDL 實踐之傳遞簡單字串

trace his int ati activity 表示 asi client text *本demo的server和client寫反了新建工程client，server 在server端新建aidl文件，內容： // IMyAidlInterface.aidl pac

Android Design Support控件之DrawerLayout簡單使用

arraylist linear popu att padding page true andro string DrawerLayout能夠讓我們在項目中非常方便地實現側滑菜單效果。如今主流的應用如QQ等都採用的這樣的效果。這兩天也是在學習Andr

Linux學習之路 -- 簡單日常使用命令

簡單日誌 reboot logs netstat oca yum a.out mysql tail -f catalina.out #在 logs 下面查看日誌（ -f 實時查看） rm -rf /var/log/httpd/access

Python實戰之dict簡單練習

簡單 fault zhang zha contain default san rom mat [‘__class__‘, ‘__contains__‘, ‘__delattr__‘, ‘__delitem__‘, ‘__dir__‘, ‘__doc__‘, ‘__eq__

[python之路]簡單介紹

發展開發 gui ipython 優缺點開始嵌入網絡線程 python介紹 #python是一個什麽樣的語言？編譯型和解釋型靜態語言和動態語言強類型定義語言和弱類型定義語言python是一門動態解釋性的強類型定義語言。 #Python的優缺點##優點Python的

Android之RecyclerView簡單使用(三)

圖片 vertica pack listview sdn art code offset ddc 使用過ListView滴小夥伴都知道。ListView有這樣一個屬性android:divider，用來設置每一個item之間切割線滴屬性。問題來了，那麽R

elasticsearch之分詞查詢

elasticsearch使用elk時，search時默認帶有分詞功能，搜索關鍵字並不精準，為方便search查詢，將分詞功能禁用：curl -XPUT http://localhost:9200/_template/template_1 -d ‘{"template" : "*","order":0,"se

操作系統開發之——一個簡單的Bootsect

版權文件 pla get 結束 fse -- 設有擴展先嚇唬一下讀者朋友呵呵，直接發代碼：（這是UOS操作系統的Bootsect）（有興趣的朋友能夠增加我們，聯系方式在最後） ;------------------------------ ;文件名稱：Boo

Elasticsearch之基本操作

ubuntu quest del ubun 存儲綠色站點 ear doc elasticsearch是一個是開源的（Apache2協議），分布式的，RESTful的，構建在Apache Lucene之上的的搜索引擎。它有很多特點例如Schema Free，Docume

Java操作Excel之POI簡單例子

comm last pre cto ada tabs cnblogs encrypted hssf 21 /** 22 * 利用POI操作Excel表單 23 * 24 * 需要jar包： 25 * HSSF針對03及以前版本，即.xls後綴

入門VMware Workstation下的Debian學習之Vim簡單使用(三)

上一個 onf 安裝 es2017 左移 let 可用 style 重做什麽是Vim？　　Vim具有程序編輯的能力,可以主動的以字體顏色辨別語法的正確性,方便程序設計。　　Vim是從vi發展出來的一個文本編輯器。代碼補完、編譯及錯誤跳轉等方便編程的功能特別豐富，在程序

分布式存儲之MogileFS簡單應用

mogilefs分布式存儲之MogileFS分布式文件系統簡單應用一．分布式存儲原理：a) 分布式存儲系統，是將數據分散存儲在多臺獨立的設備上。傳統的網絡存儲系統采用集中的存儲服務器存放所有數據，存儲服務器成為系統性能的瓶頸，也是可靠性和安全性的焦點，不能滿足大規模存儲數據的需要。分布式網絡存儲采用擴

HTML5之Notification簡單使用

element per html close style source lose app javascrip var webNotification = { init: function() { if(!this.isSupport()) { con

C語言之非常簡單的幾道題

語言 scanf void 類型比較簡單 bsp 增長語句　　C語言之非常簡單的幾道題（還是寫寫），比較簡單吧，主要有幾道題的數據類型（如，第三題）和語句順序（如，第二題）需要註意一小下下。 1．求表達式S=1*2*3……*N的值大於150時，最小的N的值

Linux 之 awk簡單了解

awk 使用awk簡單了解 awk作用：過濾、輸出內容 $1 第一列， $2 第二列依次類推，NR行號，但$0表示一行，NF表示最後結尾一列 -F 指定分隔符。例子：打印/etc/passwd文件的第一行（NR==1）,$0 表示一行 [root@localhost ~]# awk ‘NR==1 {pri

ElasticSearch之CURL操作

類型創建索引 apach 命令格式 ava 開頭 json 文件的 pat CURL的操作 curl是利用URL語法在命令行方式下工作的開源文件傳輸工具，使用curl可以簡單實現常見的get/post請求。簡單的認為是可以在命令行下面訪問url的一個工具。在cent

阿裏雲ECS安裝配置elasticsearch之坑

是否 ~~ ast span 然而命令行在外一件事 elastics 在這裏只記錄一件事情：elasticsearch 安裝完成後，需要外網訪問9200端口測試是否成功，或者訪問kibana，都需要開放端口，然而貌似阿裏雲是不支持在服務器上直接用命令行來配置的，只能去

Dubbo內核實現之SPI簡單介紹

路徑簡單 prot inter 策略模式業務 services 具體實現指定 Dubbo采用微內核+插件體系，使得設計優雅，擴展性強。那所謂的微內核+插件體系是如何實現的呢！即我們定義了服務接口標準，讓廠商去實現（如果不了解spi的請谷歌百度下）, jdk通過Serv

Elasticsearch之pythonAPI簡單使用

elasticsearch自動補全建議功能

elasticsearch內容搜索功能

scrapy框架+django框架組合使用

相關推薦