騰訊文智自然語言處理介紹與情感分析API呼叫
一.產品概述
文智中文語義開放平臺是基於平行計算系統和分散式爬蟲平臺,結合獨特的語義分析技術,一站式滿足使用者NLP、轉碼、抽取、全網資料抓取等中文語義分析需求的開放平臺。使用者能夠基於平臺對外提供的OpenAPI實現搜尋、推薦、輿情、挖掘等語義分析應用
騰訊雲文智中文語義平臺以SDK模組方式提供服務,支援多種程式語言
二.產品功能
Action id查詢:https://cloud.tencent.com/document/product/271/2050
1.分詞/命名實體識別API,提供智慧分詞(基本詞+短語)、詞性標註、命名實體識別功能。Action id=LexicalAnalysis
2.情感分析API,對資訊進行情感上的正向、負向及中性進行評價,Action id=TextSentiment
3.主題分類API,提供自動文字分類服務,目前平臺能識別的類別包括招聘、影視、音樂、健康養生、財經、廣告推廣、犯罪、政治等90多個類別
4.關鍵詞提取API,基於關鍵詞抽取平臺,為使用者實現如新聞內容關鍵詞自動提取、評論關鍵詞提取等提供基礎服務。支援自定義詞典
5.敏感資訊識別API
6.句法分析API,句法分析出句子中詞與詞間的關係,可用於提取句子主幹、核心詞等。句法分析可更好的理解句子,在機器翻譯、自動問答、知識抽取等領域均可應用
7.同義詞API
8.糾錯API,實現對短文字的自動糾錯功能,使用者只需提供業務資料和日誌
9.轉碼API,網頁轉碼和網頁名片,網頁轉碼是將PC機上展示的二維頁面轉換成移動端裝置上展示的一維頁面。網頁名片是將頁面簡化為主體圖片、標題和摘要的組合,以卡片形式展示,適合做頁面分享、收藏和推廣。使用者只需要提交網頁url
10.下載抽取API,基於分散式爬蟲系統,使用者提供url即可完成資料抓取。分散式爬蟲系統通過對全網url進行精準排程、智慧壓力挖掘、自適應頁面更新週期預測,可實現自動路由、url作弊識別、智慧主題抓取等功能
7.3.API呼叫
1.API請求結構
域名訪問地址:wenzhi.api.qcloud.com
通訊協議:HTTPS
請求方法:POST\GET均可,一般使用GET
字元編碼:utf-8
名稱 |
描述 |
備註 |
API入口 |
API呼叫WebService入口 |
https://wenzhi.api.qcloud.com/v2/index.php |
公共引數 |
每個介面都包含的通用引數 |
詳見3.公共引數 |
指令名稱 |
API要執行的指令的名稱,這裡使用Action指定,如Action=LexicalAnalysis |
完整的指令請參見 API查詢 |
指令引數 |
每個特定指令需要的引數 |
見每個指令的文智介面文件 |
2.介面鑑權-演算法在相應的py檔案中
騰訊雲控制檯->雲產品->管理工具->雲API金鑰
新建金鑰,建立一對Secretld/SecretKey
3.公共引數
名稱 |
型別 |
描述 |
必選 |
Action |
String |
介面指令的名稱,例 LexicalAnalysis |
是 |
Region |
String |
區域引數,用來標識希望操作哪個區域的例項。可選: bj:北京;gz:廣州;sh:上海;hk:香港;ca:北美 |
是 |
Timestamp |
UInt |
當前UNIX時間戳 |
是 |
Nonce |
UInt |
隨機正整數,與 Timestamp 聯合起來, 用於防止重放攻擊 |
是 |
SecretId |
String |
騰訊雲平臺上申請的標識身份的SecretId 和SecretKey,其中SecretKey會用來生成 Signature |
是 |
Signature |
String |
請求籤名,用來驗證此次請求的合法性 |
是 |
錯誤碼含義查詢:
https://cloud.tencent.com/document/product/271/2057
四.情感分析
情感分析用於判斷情感傾向,在輿情監控、話題監督、口碑分析等商業分析領域有非常重要的應用價值
1.介面描述
域名:wenzhi.api.qcloud.com 介面名: TextSentiment
2. 輸入引數
引數名稱 |
必選 |
型別 |
描述 |
content |
是 |
String |
待分析的文字(只能為utf8編碼) |
type |
是 |
Int |
(可選引數,預設為4) 1:電商;2:APP;3:美食;4:酒店和其他 |
3. 輸出引數
引數名稱 |
型別 |
描述 |
code |
Int32 |
錯誤碼,0:成功,其他值:失敗 |
message |
String |
錯誤資訊 |
positive |
Double |
正面情感概率 |
negative |
Double |
負面情感概率 |
#qcloudapi-sdk-python SDK工具包
#安裝
pip install qcloudapi-sdk-python
#情感分析API呼叫
#Python 3.6
from QcloudApi.qcloudapi import QcloudApi
# 設定需要載入的模組
module = 'wenzhi'
# 介面名-情感分析
action = 'TextSentiment'
# 雲API的公共引數-引數排序很重要(首字母排序)
config = {
'method': 'GET',
'Region': 'ap-guangzhou',
'secretId': '替換成自己的',
'secretKey': '替換成自己的',
'SignatureMethod': 'HmacSHA1'
}
# 請求引數,支援json
# 陣列'content':[1,2,3]
params = {'content':'是真的煩人','type':4}
service = QcloudApi(module, config)
#請求前修改引數(5個引數均可修改)
#service.setRegion('ap-shanghai')
# 生成請求的url,但不發起請求
print(service.generateUrl(action, params))
# 呼叫介面-發起請求
s=service.call(action, params)
print(s)
#輸出
b'{"code":0,"message":"","codeDesc":"Success","positive":0.35916191339493,"negative":0.64083808660507}'