日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > php >内容正文

php

织梦php 文章采集规则,织梦DedeCms采集有什么规则?织梦DedeCms采集规则图文教程_好特教程...

發布時間:2024/8/1 php 17 豆豆
生活随笔 收集整理的這篇文章主要介紹了 织梦php 文章采集规则,织梦DedeCms采集有什么规则?织梦DedeCms采集规则图文教程_好特教程... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

楚截圖和文字分不清楚,因此用粉色背景來區分。

第一步、確定采集的網站(我們以DEDE的官方站做為采集站做示范)

Quote:

第二步、確定被采集站的編碼。打開被采集的網頁之后,查看源代碼(IE:查看 - > 源代碼)

在 之間找到 charset 這個,后面就顯示網頁的編碼了,截圖的是 “gb2312”

第三步、采集列表獲取規則寫法

來源網址寫法 很明顯pageno是表示分頁頁碼 那么有多頁列表的采集就要用“[var:分頁]”來替換分頁頁碼,截圖如下

http://www.dedecms.com/ plus/list.php?tid=10&pageno=[var:分頁]

文章網址需包含 網址不能包含 這兩個一般不用寫,用于采集列表范圍有很多不需要的連接才用到他來做過濾使用。

上面的網址并沒有帶有至于http://www.dedecms.com 為什么要在前面加上,這個就不要我說了吧。

如果只有一個列表頁,那么在來源網址就直接寫上網址就OK了。

注意這里,最關鍵就是這里。

下面就是“采集獲取文章列表的規則寫法”,

就是上面打開的被采集頁面的源代碼文件,找到文章列表之前 和本頁面沒有其他相同的代碼

在DedeCms官方站的列表頁文章列表之前和之后最近的且沒有相同的是“

”和“ ”,分別寫入“起始HTML”和“結束HTML”,寫法看截圖

第四步、采集文章標題,文章內容,文章作者,文章來源等規則寫法,分頁采集等。

“起始HTML”和“結束HTML”寫法參考第三步中的“獲取文章列表的規則寫法”

下面講的是如何采集分頁內容 看截圖圈著的地方 截圖

文檔是否分頁 里面選擇“全部列出的分頁列表”

“起始HTML”和“結束HTML”寫法參考第三步中的“獲取文章列表的規則寫法”

小編推薦閱讀

總結

以上是生活随笔為你收集整理的织梦php 文章采集规则,织梦DedeCms采集有什么规则?织梦DedeCms采集规则图文教程_好特教程...的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。