1. 程式人生 > 程式設計 >基於python實現檢索標記敏感詞並輸出

基於python實現檢索標記敏感詞並輸出

 一些帶有過度宣傳的詞,在淘寶、京東對商品的宣傳有一定的限制,這些最佳,最大、盜版、水貨等詞語都不能用於產品的宣傳,可以使用程式檢測敏感詞,以下既是具體程式碼。

#檢索敏感詞並描紅輸出
#輸入
word = input("請輸入或拷貝含有敏感詞的宣傳文字:")
#敏感詞庫
sensitive = ['第一','國家級','最高階','最佳','獨一無二','一流','僅此一次','頂級',\
       '頂尖','尖端','極品','極佳','絕佳','絕對','終極','極致','首個','首選',\
       '獨家','首發','首次']
#在輸入語句中發現的敏感詞,放在列表中
sensitive_find = []
#newword用於標紅敏感詞,word用於迴圈
newword = word
#遍歷敏感詞庫
for item in sensitive:
  #將至少出現一次的敏感詞放到sensitive_find中,然後標紅
  if word.count(item)>0:
    sensitive_find.append(item+':'+str(word.count(item))+'次')
    #newword存放標紅後的整段話,word則不變
    newword = newword.replace(item,' \033[1;31m'+item+'\033[0m')
print('發現敏感詞如下:')
for item in sensitive_find:
  print(item)
print('敏感詞位置已用星號進行標註:\n'+newword)

結果(ps結果中有標紅的部分,這裡未顯示,下面用部分截圖說明一下):

請輸入或拷貝含有敏感詞的宣傳文字:天貓首發,耀世登場,世界品質,慶偉製造。本產品目前是同類產品中最高階的。2018年全網銷售量第一,瑤瑤領先同類產品。國內外頂級大師鼎力支援,是您居家生活的唯一選擇。
發現敏感詞如下:
第一:1次
最高階:1次
頂級:1次
首發:1次
敏感詞位置已用星號進行標註:
天貓 首發,耀世登場,世界品質,慶偉製造。本產品目前是同類產品中 最高階的。2018年全網銷售量 第一,瑤瑤領先同類產品。國內外 頂級大師鼎力支援,是您居家生活的唯一選擇。

有標紅部分的截圖

基於python實現檢索標記敏感詞並輸出

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。