1. 程式人生 > >dede過濾規則-如何過濾"(1)"這種-正則表示式

dede過濾規則-如何過濾"(1)"這種-正則表示式

國慶期間有網友問我DEDE採集裡標題怎麼過濾"(1)"這樣的()+裡面數字或者其它的.那時在外面玩,就沒幫他解決,今天突然想起,就動手幫他做了這個問題.

其實,這個問題對於會DEDE和正則表示式的人來說很簡單,但是我就奇怪了,DEDE這麼大的使用者群,為什麼就沒一個人回答他呢,我知道在DEDE的QQ群裡有好幾個高手在.哎,人啊,有點本事出名了,就自命清高,不理人了.

我不是高手,我不會正則表示式,但是我是程式設計師,開發語言大致是相通的,所以我向來不拒絕網友的請求幫助,今晚,我花了兩個小時,終於找出了結果,哎,有點丟人,對不起我的職業啊.

其實很簡單,採集節點設定的"標題過濾規則"裡寫上這行程式碼就可以的: {dede:

trim}(//([0-9]*//)){/dede:trim}

我這裡說明一下原因

([0-9]*) 中[0-9]表示數字0-9,一位數字,[]外面的*號表示可以多個,也就可以過濾大於9的幾位數字,如10,11,12......

開始時,我一直只寫{dede:trim}([0-9]*){/dede:trim}這個程式碼,結果發現過濾後,標題的()還在,只是過濾了裡面的數字

後來才想到,()是特殊字元,不會當成是字元來過濾,如果要過濾的話,就要加 / 來進行轉義

所以寫成程式碼為:  {dede:trim}(/([0-9]*/)){/dede:trim} 可是結果還是不行,和前面一樣,還是有()留下來,沒有過濾.

想了,測試了近一個小時,突然想到,可能在DEDE裡會直接過濾一些字元,後來真發現了 

這個符號沒有了,果然是被過濾了,那我就加兩個 試一下吧,過濾一個,那總會還留下一個吧. 測試一下,嘿嘿,成功了.

其實,真的很簡單,我不會正則表示式,最後也是成功了啊,事情就是這樣,多動手做做,總會成功,像別人說的,靠別人不行,一定得靠自己.

相關推薦

dede過濾規則-如何過濾"(1)"這種-表示式

國慶期間有網友問我DEDE採集裡標題怎麼過濾"(1)"這樣的()+裡面數字或者其它的.那時在外面玩,就沒幫他解決,今天突然想起,就動手幫他做了這個問題. 其實,這個問題對於會DEDE和正則表示式的人來說很簡單,但是我就奇怪了,DEDE這麼大的使用者群,為什麼就沒一個人回答他呢

Python 3.7.1 模組 表示式 re

正則表示式操作 1. 正則表示式語法 1.1 特殊字元 . ^ $ * + ? *?,+?,?? {m} {m,n} {m,n}

筆記(Python核心程式設計 第 1 部分 通用應用主題 1表示式

                     Python核心程式設計 第 1 部分 通用應用主

Python爬蟲--- 1.4 表示式:re庫

原文連結:https://www.fkomm.cn/article/2018/7/20/19.html 想要學習爬蟲,正則表示式是一定繞不過去的一關。正則表示式是我們在篩選文字資料是經常使用的利器。簡單來說,一個正則表示式表達了符合這一規則的一系列的文字。 從“萬用字元”到正則表示式 玩lin

筆記(Python核心程式設計 第 1 部分 通用應用主題 1表示式

                     Python核心程式設計 第 1 部分 通用應用主題 1 章 正則表示式 管道符號(|):表示一個“從多個模式中選擇其 一”的操作。它用於分割不同的正則表示式。就能夠增強正則表示式的靈活性,使得正則表示式能夠匹配多個

【爬蟲學習1表示式加Requests爬取貓眼電影排行

Requests獲取網頁資料 運用Requests獲得網頁 import requests ##獲取單個網頁資料 def get_one_page(url): response = requests.get(url) r

從0到1打造表示式執行引擎

@[toc] 今天是五一假期第一天,這裡先給大家拜個晚 咳咳!!祝大家五一快樂,我這裡給大家奉上一篇硬核教程。首先宣告,這篇文章不是教你如何寫正則表示式,而是教你寫一個能執行正則表示式的**執行引擎**。 網上教你寫正則表示式的文章、教程很多,但教你寫引擎的並不多。很多人認為我就是用用而已,沒必要理解那麼深,

Java表示式過濾、替換,將一段文字中的英語單詞分別提取出,並統計詞頻,按詞頻排序。

最近在學習自然語言處理,在建立基礎標籤庫時,遇到一個需要提取語料中的英文單詞的工作,做好了現在來和大家分享下。 實現效果:讀取檔案內容,把其中的英文單詞提取出,並統計詞頻。提取時,原本不是連在一起的單詞可以分開獨立提取,例如:我的PPT和WORD,可以提取出PPT,WORD兩個單詞。 基本思

python re.sub 表示式過濾指定字元

re.sub(pattern, repl, string, count=0, flags=0) Return the string obtained by replacing the leftmost non-overlapping occurrences o

表示式 _ 內網IP 過濾

    我們在平時的生活中,可能會有 內網 IP 過濾的需求。 一般需要過濾以下幾個網段跟 ip 區域網可使用的網段(私網地址段)有三大段: 10.0.0.0~10.255.255.255(A類) 172.16.0.0~172.31.255.255(B類)

常用表示式大全——包括校驗數字、字元、特殊密碼過濾

原文連結http://www.cnblogs.com/zxin/archive/2013/01/26/2877765.html 常用正則的,可以在下面找到最適用的正則,前端常用的,收藏,不用每次都去找; 介紹: 1、'?=.'的意思是斷言;只匹配一個位置比如,你想匹配一個“人”字,但是你只想匹配中國人的

機器學習實戰中,第四章樸素貝葉斯,過濾垃圾郵件,表示式切分郵件內容得出字母的問題解決方法

原文中的程式碼:listOfTokens = re.split(r'\W*', bigString) 修改為:listOfTokens = re.split(r'\W+', bigString)

如何使用 awk 和表示式過濾文字或檔案中的字串

當我們在 Unix/Linux 下使用特定的命令從字串或檔案中讀取或編輯文字時,我們經常需要過濾輸出以得到感興趣的部分。這時正則表示式就派上用場了。 什麼是正則表示式? 正則表示式可以定義為代表若干個字元序列的字串。它最重要的功能之一就是它允許你過濾一條命令或一個檔案的輸出

javascript 表示式過濾sql關鍵字

var reg = /(\bDROP\b)|(\bTRUNCATE\b)|(\bDELETE\b)|(\bUPDATE\b)|(\bINSERT\b)|(\bEXEC\b)|(\bEXECUTE\b)

shell之文字過濾表示式

當從一個檔案或命令輸出中抽取或過濾文字時,可以使用正則表示式(R E) ,正則表示式是一些特殊或不很特殊的字串模式的集合。 ^ 只只匹配行首 $ 只只匹配行尾 * 只一個單字元後緊跟*,匹配0個或多個此單字元 [ ] 只匹配[ ] 內字元。可以是一個單字元,也可以是字元序

萬用字元與表示式過濾手機號,ip地址)

萬用字元 萬用字元: 鍵盤上的一些符號,在查詢某些檔案時 不知道檔案全名或由於名字太長,不想輸入全名的情況下 常常使用萬用字元 來代替一個或多個字元.(用於匹配符合條件的檔名,完全匹配) *:匹配任意多個字元或者0個字元 ?:任意一個字元 [^]:匹配

表示式(靚號過濾

一般公司在開發一類對的號碼時,會預留一些號碼給以後升級的會員使用,比如旺旺靚號,QQ號等,採用正則表示式實現較好,通過規則引擎的後臺頁面做成實時可配置的也是不錯的選擇。 一. 一般會有如下的正則需求 程式碼如下: Java程式碼   public clas

WHERE子句使用表示式進行搜尋過濾

正則表示式:在列值內進行匹配(萬用字元匹配整列) 1基本字元匹配 SELECT prod_name FROM products WHERE prod_name REGEXP ‘1000’ ORDER BY prod_name; SELECT p

Python通過表示式獲取,去除(過濾)或者替換HTML標籤的幾種方法(本文由169it.com蒐集整理)

python正則表示式關鍵內容: python正則表示式轉義符: . 匹配除換行符以外的任意字元 \w 匹配字母或數字或下劃線或漢字 \s 匹配任意的空白符 \d 匹配數字 \b 匹配單詞的開始或結束 ^ 匹配字串的開始 $ 匹配字串的結束 \W 匹配任意不是字母,數字

過濾表情獲取過濾後的字元長度(通過表示式

import java.util.regex.Pattern; /** * Created by Basil on 2017/5/10 13:00 */ public class GetInputContentLengh { //加入白名單 public stat