Java 敏感詞過濾,Java 敏感詞替換,Java 敏感詞工具類
阿新 • • 發佈:2017-09-25
blog rds log code ima 方法 www enter iteye
Java 敏感詞過濾,Java 敏感詞替換,Java 敏感詞工具類
===========================
?Copyright 蕃薯耀 2017年9月25日
http://www.cnblogs.com/fanshuyao/
一、問題描述
很多對外網站的某些內容都需要過濾敏感詞,避免政治與色@情上的問題。
二、解決方案
使用詞庫進行匹配過濾成 * (星號)
Java 敏感詞工具類及敏感詞詞庫見附件。
1、下載後,有幾個類,主要為WordFilter 這個工具類,使用方法如下:
Java代碼- content = WordFilter.doFilter(content);//敏感詞過濾
就是這麽簡單。
2、配置文件共有2個, 在resources文件夾中,
sensitiveWords.txt :敏感詞詞庫
sensitiveWordsSplitCode.txt :敏感詞中間的分隔符
為什麽會有分隔符,如很多人通過在敏感詞之間增加分隔符或其它字符逃避系統敏感詞的過濾,如:
色@情(中間不加@,不讓我提交) 寫成 色@情,可能有些系統就不能過濾了,而sensitiveWordsSplitCode.txt 就起到這樣的作用,就算用別的字符分隔,也能識別出來進行過濾。
把這2個配置文件放在src/main/resources下,這個是Maven項目的,JavaWeb項目放在src下。
最後,到處結束了
下載附件走起吧。
附件下載地址:http://fanshuyao.iteye.com/blog/2394157
===========================
?Copyright 蕃薯耀 2017年9月25日
http://www.cnblogs.com/fanshuyao/
Java 敏感詞過濾,Java 敏感詞替換,Java 敏感詞工具類