1. 程式人生 > >親測java清除html標籤

親測java清除html標籤

 String regEx_script="<script[^>]*?>[\\s\\S]*?<\\/script>"; //定義script的正則表示式 
        String regEx_style="<style[^>]*?>[\\s\\S]*?<\\/style>"; //定義style的正則表示式 
        String regEx_html="<[^>]+>"; //定義HTML標籤的正則表示式 
         
        Pattern p_script=Pattern.compile(regEx_script,Pattern.CASE_INSENSITIVE); 
        Matcher m_script=p_script.matcher(htmlStr); 
        htmlStr=m_script.replaceAll(""); //過濾script標籤 
         
        Pattern p_style=Pattern.compile(regEx_style,Pattern.CASE_INSENSITIVE); 
        Matcher m_style=p_style.matcher(htmlStr); 
        htmlStr=m_style.replaceAll(""); //過濾style標籤 
         
        Pattern p_html=Pattern.compile(regEx_html,Pattern.CASE_INSENSITIVE); 
        Matcher m_html=p_html.matcher(htmlStr); 
        htmlStr=m_html.replaceAll(""); //過濾html標籤 


        return htmlStr.trim(); //返回文字字串 

相關推薦

java清除html標籤

 String regEx_script="<script[^>]*?>[\\s\\S]*?<\\/script>"; //定義script的正則表示式          String regEx_style="<style[^>]

Javahtml標籤的過濾和清洗

OWASP HTML Sanitizer 是一個簡單快捷的java類庫,主要用於放置XSS 優點如下:   1.使用簡單。不需要繁瑣的xml配置,只用在程式碼中少量的編碼   2.由Mike Samuel(谷歌工程師)維護   3.通過了AntiSamy超過95%的UT覆蓋   4.高效能,低記憶體

Python3之正則清除html標籤

程式碼示例 impoort re def clear_html_re(content): ''' 正則清除HTML標籤 :param content:原文字 :return: 清除後的文字 ''' s_content = re.sub(

正則清除HTML標籤但保留其中一部分標籤

str="<a href=""a.htm"">a.htm</a><div>afefe</div>feaa<b>bbb</b> <a href=http://www.baidu.com id=""ggg"">ggg</a

php清除html標籤,除空格和換行

方法一,strip_tags()剝去字串中的 HTML 標籤: <?php echo strip_tags("Hello <b>world!</b>"); //執行結

JAVA處理html標籤

package com.nfa; import java.util.regex.Matcher; import java.util.regex.Pattern; public class UtilHtml { /*刪除所有HTML標籤,返回純文字*/ publi

Java去掉HTML標籤

public static String stripHtml(String content) {     // <p>段落替換為換行     content = content.replaceAll("<p .*?>", "\r\n");    

java實現HTML標籤轉義和反轉義(StringEscapeUtils)

轉義:有時需要對帶有格式的長文字(如個人文章或評論等)進行轉義後儲存到資料庫表中。       例如:String EsHtml="<p>我的<br/>評論</p>";                  轉義後為"&lt;p&am

windows下的java項目打jar分別編寫在windows與linux下運行的腳本( 本人可用!)

總結 有一個 ack unzip next 技術 方法 MF .bat 前言: 最近公司做了一個工具,要將這個工具打包成一個可運行的程序,編寫start.bat和start.sh在windows和linux下都可以運行。 在網上找了很多資料,最後終於找到一個可靠的資料,記錄

Java反射:如何正確理解,不如手寫一個(反射包分析、樓主)

Java反射機制、動態代理是基於什麼原理? 這個問題可謂是老生常談的一個熱門問題了,如果沒有深入的思考還真的是很難回到上來。那麼今天我們一起來看看,如何正確清晰的認識這個熱門卻又說簡單又不簡單說複雜又比較複雜的問題。 一、什麼是反射 反射機制是Java語言提供的一種基礎功能

java學習筆記(三)手機號碼歸屬地批量查詢的程式碼,可用

重要的事情說一遍,注意本程式碼實現的優點是批量查詢!!! 當前單個手機號碼查詢也是沒有問題的。 由於公司行業主要是展會行業,展會上的觀眾註冊等,填寫基本資訊的時候會採集手機號等資訊,展會結束後我們需要做資料分析。只有通過手機號查詢歸屬地來獲取客戶的地域資訊。找了好多平臺和api,發現沒有說是

Java Map型別與Json字串的互相轉換----------有效

import java.io.BufferedReader; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader; impor

java swing 製作一個登陸介面,有效

一、介紹 Swing 是一個為Java設計的GUI工具包。 Swing是JAVA基礎類的一部分。 Swing包括了圖形使用者介面(GUI)器件如:文字框,按鈕,分隔窗格和表。 Swing提供許多比AWT更好的螢幕顯示元素。它們用純Java寫成,所以同Java本身一樣可以跨平臺執行,這一點不像AWT。它

maven maven-war-plugin 解決java war專案間的依賴(兩個war都可獨立部署執行,maven 3.2.x

最近整理基礎框架,有些專案不想分散式,所以基礎框架必須同時可獨立部署,也可直接被作為依賴和業務工程打到一起,記錄下解決war專案依賴的要點,一開始用warpath,結果報找不到,有些帖子還是17年的,於是繼續檢視。 warpath 是個坑,按照網上的說明基本跑不通,可能是maven-war-plugin 升

Java 模擬http請求 可用

原創地址  http://www.cnblogs.com/vitre/p/5474166.html 注意 相關包路徑 不要導錯 package ln; import java.io.BufferedReader; import java.io.IOException; imp

Springboot2.0 傳送HTML 格式的郵件。【有效】

目的:使用 Springboot2.0 傳送 HTML 格式的郵件   這是建立在 你會使用 springboot2.0 傳送郵件的基礎上,參考這篇部落格: https://blog.csdn.net/Tomwildboar/article/details/83028375

java 手機號正則表示式 2018年3月(可用)

import java.util.regex.Matcher; import java.util.regex.Pattern; import org.apache.commons.lang3.StringUtils; /** * @author kpzc *三大運

Java去除基本的HTML標籤

// 去除基本的標籤     public static String replaceHtmlBasicTag(String content, String replacement) {         S

原生select下拉html標籤以及預設選中以及清除選中

//html標籤  <select name="dType" id="dType" style="width: 100%;height: 85%"> <

java學習筆記(三)手機歸屬地查詢的程式碼,可用

由於公司行業主要是展會行業,展會上的觀眾註冊等,填寫基本資訊的時候會採集手機號等資訊,展會結束後我們需要做資料分析。只有通過手機號查詢歸屬地來獲取客戶的地域資訊。找了好多平臺和api,發現沒有說是能批量處理手機號資訊。最後還是找了githup上找到一個外掛,感謝