1. 程式人生 > 程式設計 >python 利用jieba.analyse進行 關鍵詞提取

python 利用jieba.analyse進行 關鍵詞提取

1、簡單應用

程式碼如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File : jieba.analyse.py
# @Author: 趙路倉
# @Date : 2020/3/14
# @Desc : 提取關鍵字
# @Contact : [email protected]

import jieba.analyse


text='安全、防止水合物和段塞生成的重要措施之一。因此,針對未來還上油田開發技術,我們預先開展了水深1500米管道式油氣水分離器的概念設計。通過該研究,提出適合海洋環境的體積小、重量輕、分離效率高、便於操作和維護的新型油氣水三相分離器,使其成為海洋深水油氣田開'
Key=jieba.analyse.extract_tags(text,topK=3)
print(Key)

python 利用jieba.analyse進行 關鍵詞提取

2、含參使用

keywords = jieba.analyse.extract_tags(content,topK=5,withWeight=True,allowPOS=())
  • 第一個引數:待提取關鍵詞的文字
  • 第二個引數:返回關鍵詞的數量,重要性從高到低排序
  • 第三個引數:是否同時返回每個關鍵詞的權重
  • 第四個引數:詞性過濾,為空表示不過濾,若提供則僅返回符合詞性要求的關鍵詞

程式碼如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File : jieba.analyse.py
# @Author: 趙路倉
# @Date : 2020/3/14
# @Desc : 提取關鍵字
# @Contact : [email protected]

import jieba.analyse


# 字串前面加u表示使用unicode編碼
content = u'安全、防止水合物和段塞生成的重要措施之一。因此,針對未來還上油田開發技術,我們預先開展了水深1500米管道式油氣水分離器的概念設計。通過該研究,提出適合海洋環境的體積小、重量輕、分離效率高、便於操作和維護的新型油氣水三相分離器,使其成為海洋深水油氣田開'

keywords = jieba.analyse.extract_tags(content,allowPOS=())
# 訪問提取結果
for item in keywords:
  # 分別為關鍵詞和相應的權重
  print(item[0],item[1])

python 利用jieba.analyse進行 關鍵詞提取

以上就是python 利用jieba.analyse進行 關鍵詞提取的詳細內容,更多關於python 關鍵詞提取的資料請關注我們其它相關文章!