基於python實現檢索標記敏感詞並輸出
阿新 • • 發佈:2020-05-09
一些帶有過度宣傳的詞,在淘寶、京東對商品的宣傳有一定的限制,這些最佳,最大、盜版、水貨等詞語都不能用於產品的宣傳,可以使用程式檢測敏感詞,以下既是具體程式碼。
#檢索敏感詞並描紅輸出 #輸入 word = input("請輸入或拷貝含有敏感詞的宣傳文字:") #敏感詞庫 sensitive = ['第一','國家級','最高階','最佳','獨一無二','一流','僅此一次','頂級',\ '頂尖','尖端','極品','極佳','絕佳','絕對','終極','極致','首個','首選',\ '獨家','首發','首次'] #在輸入語句中發現的敏感詞,放在列表中 sensitive_find = [] #newword用於標紅敏感詞,word用於迴圈 newword = word #遍歷敏感詞庫 for item in sensitive: #將至少出現一次的敏感詞放到sensitive_find中,然後標紅 if word.count(item)>0: sensitive_find.append(item+':'+str(word.count(item))+'次') #newword存放標紅後的整段話,word則不變 newword = newword.replace(item,' \033[1;31m'+item+'\033[0m') print('發現敏感詞如下:') for item in sensitive_find: print(item) print('敏感詞位置已用星號進行標註:\n'+newword)
結果(ps結果中有標紅的部分,這裡未顯示,下面用部分截圖說明一下):
請輸入或拷貝含有敏感詞的宣傳文字:天貓首發,耀世登場,世界品質,慶偉製造。本產品目前是同類產品中最高階的。2018年全網銷售量第一,瑤瑤領先同類產品。國內外頂級大師鼎力支援,是您居家生活的唯一選擇。
發現敏感詞如下:
第一:1次
最高階:1次
頂級:1次
首發:1次
敏感詞位置已用星號進行標註:
天貓 首發,耀世登場,世界品質,慶偉製造。本產品目前是同類產品中 最高階的。2018年全網銷售量 第一,瑤瑤領先同類產品。國內外 頂級大師鼎力支援,是您居家生活的唯一選擇。
有標紅部分的截圖
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。