1. 程式人生 > >Java刪除富文字的標籤

Java刪除富文字的標籤

1、富文字格式是什麼?

富文字格式是指使用者在富文字框輸入的類容,這些內容在儲存的時候會將你操作的樣式利用程式碼的形式儲存到資料庫,從資料庫拿出資料的時候,這些程式碼又會重新轉成樣式。

2、富文字中除了刪除標籤獲取到文字以外,還有其他的方式能只獲取文字嗎?

可以的。可以將富文字轉成文字!

轉文字可以參考筆者的這個部落格!https://blog.csdn.net/qq_36138652/article/details/81489060

3、怎麼講文字中的標籤刪除呢?

可以利用下面這個方法來懟富文字的標籤進行刪除!

public static String delHTMLTag(String htmlStr) {
        String script = "<script[^>]*?>[\\s\\S]*?<\\/script>";
        String style = "<style[^>]*?>[\\s\\S]*?<\\/style>";
        String html = "<[^>]+>";
        String space = "(\r?\n(\\s*\r?\n)+)";
        String white = "&nbsp;";
        Pattern pScript = Pattern.compile(script, 2);
        Matcher mScript = pScript.matcher(htmlStr);
        htmlStr = mScript.replaceAll("");
        Pattern pStyle = Pattern.compile(style, 2);
        Matcher mStyle = pStyle.matcher(htmlStr);
        htmlStr = mStyle.replaceAll("");
        Pattern pHtml = Pattern.compile(html, 2);
        Matcher mHtml = pHtml.matcher(htmlStr);
        htmlStr = mHtml.replaceAll("");
        Pattern pSpace = Pattern.compile(space, 2);
        Matcher mSpace = pSpace.matcher(htmlStr);
        htmlStr = mSpace.replaceAll("");
        htmlStr = htmlStr.replaceAll(white, "");
        return htmlStr.trim();
    }