1. 程式人生 > >正則表示式過濾特殊字元

正則表示式過濾特殊字元

 String regEx="[`[email protected]#$%^&*()_\\-+=|{}':;',\\[\\].<>/?~!@#¥%……&*()——+|{}【】‘;:”“’。,、?]";  
        Pattern   p   =   Pattern.compile(regEx);     
        Matcher   m   =   p.matcher(searchKeyWord);     
        searchKeyWord =  m.replaceAll("").trim(); 

匹配中文,正則表示式:[\u4E00-\u9FA5]因中文的unicode碼的範圍是這個。

匹配數字,[0-9|.] 這個可以匹配整數和小數。

匹配英文字母,[a-z|A-Z] 匹配大小寫的英文字元。

空白字元,[\s] 也許在程式中需要寫成[\\s] ,這樣\r,\n,\t,space,和其他的空白字元都可以匹配,而非空白字元就是加上一個^,寫作:[^\\s]


相關推薦

c#表示式過濾特殊字元

碰到了一個問題,要過濾字串中的|#|$|^|*|(|)|+|{|?|[|.這種字元。可是這些字元時正則表示式中的特殊字元,怎麼辦呢?有兩種辦法。 主要的思路是把 類似 “*” “[”的Relpace 為“\*”,"\["等 1,直接替換。 splitKey = split

表示式過濾特殊字元

String regEx="[`[email protected]#$%^&*()_\\-+=|{}':;',\\[\\].<>/?~!@#¥%……&*()——+|{}【】‘;:”“’。,、?]"; Pattern

python re.sub 表示式過濾指定字元

re.sub(pattern, repl, string, count=0, flags=0) Return the string obtained by replacing the leftmost non-overlapping occurrences o

表示式特殊字元

匹配前面一個表示式0次或者1次。等價於 {0,1}。 例如,/e?le?/ 匹配 "angel" 中的 'el',和 "angle" 中的 'le' 以及"oslo' 中的'l'。 如果緊跟在任何量詞 *、 +、? 或 {} 的後面,將會使量詞變為非貪婪的(匹配儘量少的字元),和預設使用的貪婪模式(匹

表示式轉義特殊字元

正則表示式中的特殊字元如下表: 今天在用正則匹配HTTP響應體中的字串時遇到了一些問題,要匹配的資料包如下圖: 要匹配其中的字串如下圖: 很明顯由http響應頭Content-Type

Day004_Linux基礎命令之特殊符號與表示式萬用字元

特殊符號: . 點 cd . 表示當前目錄 ' '' 單引號,所見即所得 原封不動輸出 " ""雙引號,裡面的特殊符號會被解析執行   `` ====$( ) 先執行() 裡的命令,把結果留下 > 重定向符號  先清空檔案內容, 再追加檔案最後一行 &

[C/C++標準庫]_[初級]_[使用表示式過濾Windows檔名中的非法字元]

場景 1.Windows和macOS的檔名有自己的命名規則, 特別是Windows的檔名限制了不允許使用的特殊字元. 在使用這些檔名新建檔案時會建立失敗. 說明 1.在前面的文章裡在Windo

asp中用表示式過濾字元,避免注入攻擊

Pattern 屬性的用法: Function RegExpTest(patrn, strng) Dim regEx ' 建立變數。 Set regEx = New RegExp ' 建立正則表示式。 regEx.Pattern = patrn ' 設定模式。 regEx.IgnoreCase = True

Python中表示式對單個字元,多個字元,匹配邊界等使用

         Regular Expression,正則表示式,又稱正規表示式、正規表示法、正則表示式、規則表示式、常規表示法(英語:Regular Expression,在程式碼中常簡寫為regex、regexp或RE),是電腦科學的一個概

Java表示式過濾、替換,將一段文字中的英語單詞分別提取出,並統計詞頻,按詞頻排序。

最近在學習自然語言處理,在建立基礎標籤庫時,遇到一個需要提取語料中的英文單詞的工作,做好了現在來和大家分享下。 實現效果:讀取檔案內容,把其中的英文單詞提取出,並統計詞頻。提取時,原本不是連在一起的單詞可以分開獨立提取,例如:我的PPT和WORD,可以提取出PPT,WORD兩個單詞。 基本思

C# 表示式檢查輸入字元

public class Validator 2 { 3 #region 匹配方法 4 /// <summary> 5 /// 驗證字串是否匹配正則表示式描述的規則 6

表示式-校驗字元表示式

一丶概述 業務需求要檢驗一些字串,特地收集了一些關於字元的正則表示式 基礎知識:Java 正則表示式 常用正則表示式 二、程式碼 1 漢字:^[\u4e00-\u9fa5]{0,}$ 2 英文和數字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$

js利用表示式修改某個字元

   js中由於沒有replaceAll()方法,需要替換字串的某些字元時候,得重複呼叫replace()方法,很是累贅。  可以採用正則表示式處理,如以下程式把toolsStartTime中的‘-’替換為‘/’。     var

表示式特殊符號

特殊符號 代表意義 [:alnum:] 代表英文大小寫字元及數字,即0~9、A~Z、a~z [:alpha:] 代表任何英文大小寫字元,即A~Z、a~z [

開啟檔案獲取檔名,表示式獲取特定字元

using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.

如何使用 awk 和表示式過濾文字或檔案中的字串

當我們在 Unix/Linux 下使用特定的命令從字串或檔案中讀取或編輯文字時,我們經常需要過濾輸出以得到感興趣的部分。這時正則表示式就派上用場了。 什麼是正則表示式? 正則表示式可以定義為代表若干個字元序列的字串。它最重要的功能之一就是它允許你過濾一條命令或一個檔案的輸出

javascript 表示式過濾sql關鍵字

var reg = /(\bDROP\b)|(\bTRUNCATE\b)|(\bDELETE\b)|(\bUPDATE\b)|(\bINSERT\b)|(\bEXEC\b)|(\bEXECUTE\b)

關於表示式匹配任意字元

今天在Java中想使用正則表示式來獲取一段文字中的任意字元。於是很隨意得就寫出如下匹配規則: (.*) 結果執行之後才發現,無法獲得換行之後的文字。於是查了一下手冊,才發現正則表示式中,“.”(點符號)匹配的是除了換行符“/n”以外的所有字元。同時,手冊上還有一句話:要匹配

js 表示式去除html字元中所有的標籤(img標籤除外)

廢話不多說,直接上程式碼:description.replace(/<(?!img).*?>/g, ""); 如果保留img,p標籤,則為:description.replace(/<

表示式的常用字元整合文件

1、普通字元 匹配規則:匹配相應的普通字元 e.g. In [9]: re.findall("abc","abcksjdabclkjks") Out[9]: ['abc', 'abc'] 2、或: 元字元:ab | cd  匹配規則:匹配|兩邊任意一個正則表示式符合的