1. 程式人生 > >DedeCMS採集過濾正則表示式大全

DedeCMS採集過濾正則表示式大全

下面是在綜合論壇上網友的各種正則的一個全集:

{dede:trim}
{/dede:trim}
{dede:trim}<param([^>]*)>{/dede:trim}
{dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim}
{dede:trim}<embed([^>]*)>{/dede:trim}
{dede:trim}</embed>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<object([^>]*)>{/dede:trim}
{dede:trim}</object>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>{/dede:trim}
{dede:trim}</OBJECT>{/dede:trim}
{dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim}
{dede:trim}<iframe([^>]*)>{/dede:trim}
{dede:trim}</iframe>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>{/dede:trim}
{dede:trim}</IFRAME>{/dede:trim}
{dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim}
{dede:trim}<font([^>]*)>{/dede:trim}
{dede:trim}</font>{/dede:trim}
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim}
{dede:trim}<td([^>]*)>{/dede:trim}
{dede:trim}</td>{/dede:trim}
{dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim}
{dede:trim}<tr([^>]*)>{/dede:trim}
{dede:trim}</tr>{/dede:trim}
{dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim}
{dede:trim}<tbody>{/dede:trim}
{dede:trim}</tbody>{/dede:trim}
{dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim}
{dede:trim}<table([^>]*)>{/dede:trim}
{dede:trim}</table>{/dede:trim}
{dede:trim}<img([^>]*)>{/dede:trim}
{dede:trim}<span([^>]*)>{/dede:trim}
{dede:trim}</span>{/dede:trim}
{dede:trim} {/dede:trim}
{dede:trim}<stong>{/dede:trim}
{dede:trim}</stong>{/dede:trim}


應用示例一:標題中空格的過濾
經常在採集
文章的時候,標題文字裡面有空格,採回來後應用很是麻煩,所以需要在過濾處新增下面正則過濾

{dede:trim} {/dede:trim}


應用示例二:來源作者中連線的過濾
採集文章的時候,有的系統裡面作者或者來源處都有連線,直接採集的話將連線採集回來了,然後由於這兩個欄位有限制,通常會造成需要採集的內容沒有採集回來,所以需要在過濾處新增下面正則過濾

{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}


應用示例三:文章內容中連線以及其他廣告程式碼的過濾
這個就不用說了,當需要對所有東西過濾的時候,直接用上面所有的程式碼過濾就可以,但是實際應用中,我們只需要對連線、動畫、呼叫等進行過濾。(這個需要按照對方內容裡面具體含有什麼程式碼來具體操作)
一般的只有連結,使用二中的程式碼進行過濾就可以了,但是實際上一般的網站現在都在內容裡面加有廣告等,所以採取下面的過濾正則就可以完成過濾:

{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<s cript([^>]*)>([^>]*)</s cript>{/dede:trim}


應用示例四:過濾GG廣告程式碼
其實這個就是在上面的內容過濾,但是很多論壇裡的網友經常問這個,所以單獨作為一個應用列出來:

{dede:trim}<s cript([^>]*)>([^>]*)</s cript>{/dede:trim}