日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

dedecms(织梦)采集规则规则宝典

發(fā)布時間:2024/8/1 编程问答 51 豆豆
生活随笔 收集整理的這篇文章主要介紹了 dedecms(织梦)采集规则规则宝典 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
dedecms 采集系統(tǒng)確實很不錯,可以免去一些站長手工添加信息的麻煩,設(shè)置一下采集規(guī)則、采集點(diǎn),然后點(diǎn)采集,OK,幾百篇文章就搞定了!呵呵,確實很省事的!下面介紹幾種常用的采集規(guī)則的過濾方法:

應(yīng)用示例一:標(biāo)題中空格的過濾
經(jīng)常在采集文章的時候,標(biāo)題文字里面有空格,采回來后應(yīng)用很是麻煩,所以需要在過濾處添加下面正則過濾

{dede:trim} {/dede:trim}

應(yīng)用示例二:來源作者中連接的過濾
小龍 在采集文章的時候,有時會碰到作者混淆時,推薦采集時指定文章作者 ,有的系統(tǒng)里面作者或者來源處都有連接,直接采集的話將連接采集回來了,然后由于這兩個字段有限制,通常會造成需要采集的內(nèi)容沒有采集回來,所以需要在過濾處添加下面正則過濾

{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}

應(yīng)用示例三:文章內(nèi)容中連接以及其他廣告代碼的過濾
這個就不用說了,當(dāng)需要對所有東西過濾的時候,直接用上面所有的代碼過濾就可以,但是實際應(yīng)用中,我們只需要對連接、動畫、調(diào)用等進(jìn)行過濾。(這個需要按照對方內(nèi)容里面具體含有什么代碼來具體操作)
一般的只有鏈接,使用二中的代碼進(jìn)行過濾就可以了,但是實際上一般的網(wǎng)站現(xiàn)在都在內(nèi)容里面加有廣告等,所以采取下面的過濾正則就可以完成過濾:

{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}

應(yīng)用示例四:過濾GG廣告代碼
其實這個就是在上面的內(nèi)容過濾,但是很多論壇里的網(wǎng)友經(jīng)常問這個,所以單獨(dú)作為一個應(yīng)用列出來:

{dede:trim}<script([^>]*)>([^>]*)</script>{/dede:trim}


下面是在綜合論壇上網(wǎng)友的各種正則的一個全集:

{dede:trim}
{/dede:trim}
{dede:trim}<param([^>]*)>{/dede:trim}
{dede:trim}<embed([^>]*)>([^>]*)</embed>{/dede:trim}
{dede:trim}<embed([^>]*)>{/dede:trim}
{dede:trim}</embed>{/dede:trim}
{dede:trim}<object([^>]*)>([^>]*)</object>{/dede:trim}
{dede:trim}<object([^>]*)>{/dede:trim}
{dede:trim}</object>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>([^>]*)</OBJECT>{/dede:trim}
{dede:trim}<OBJECT([^>]*)>{/dede:trim}
{dede:trim}</OBJECT>{/dede:trim}
{dede:trim}<iframe([^>]*)>([^>]*)</iframe>{/dede:trim}
{dede:trim}<iframe([^>]*)>{/dede:trim}
{dede:trim}</iframe>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>([^>]*)</IFRAME>{/dede:trim}
{dede:trim}<IFRAME([^>]*)>{/dede:trim}
{dede:trim}</IFRAME>{/dede:trim}
{dede:trim}<font([^>]*)>([^<]*)</font>{/dede:trim}
{dede:trim}<font([^>]*)>{/dede:trim}
{dede:trim}</font>{/dede:trim}
{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}
{dede:trim}<a([^>]*)>{/dede:trim}
{dede:trim}</a>{/dede:trim}
{dede:trim}<td([^>]*)>([^>]*)</td>{/dede:trim}
{dede:trim}<td([^>]*)>{/dede:trim}
{dede:trim}</td>{/dede:trim}
{dede:trim}<tr([^>]*)>([^>]*)</tr>{/dede:trim}
{dede:trim}<tr([^>]*)>{/dede:trim}
{dede:trim}</tr>{/dede:trim}
{dede:trim}<tbody([^>]*)>([^>]*)</tbody>{/dede:trim}
{dede:trim}<tbody>{/dede:trim}
{dede:trim}</tbody>{/dede:trim}
{dede:trim}<table([^>]*)>([^>]*)</table>{/dede:trim}
{dede:trim}<table([^>]*)>{/dede:trim}
{dede:trim}</table>{/dede:trim}
{dede:trim}<img([^>]*)>{/dede:trim}
{dede:trim}<span([^>]*)>{/dede:trim}
{dede:trim}</span>{/dede:trim}
{dede:trim} {/dede:trim}
{dede:trim}<stong>{/dede:trim}
{dede:trim}</stong>{/dede:trim}

好了,上面四種應(yīng)用基本上涵蓋了采集的各種應(yīng)用,掌握了這個,過濾基本上就不用求人了!

總結(jié)

以上是生活随笔為你收集整理的dedecms(织梦)采集规则规则宝典的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。