火车头分页post php,轻松搞定PHPCMS V9火车头采集自动分页
這幾天一直在用火車頭做采集,途中遇到很多的問(wèn)題,也參考了PHPCMS和火車頭上很多的資料,這里多謝前輩們的指導(dǎo),但好像他們說(shuō)得都不全面,今天我把最近解決的問(wèn)題和大家一起來(lái)分享,這里以PHPCMS v9為例.
一:首先到這里下載PHPCMS V9 火車頭采集接口,分GKB和UTF-8的,地址是:http://board.locoy.com/?post=80
二:下載完后,解壓到本地硬盤(pán)上,這里面一共有4個(gè)文件,根據(jù)你的PHPCMS版本把接口文件上傳到你的網(wǎng)站根目錄,建議更改接口名字,注意,在上傳之前最好在本地,本機(jī),上把$password='123456'(第十行左右)改為你自己的驗(yàn)證密碼,修改后再上傳.
三:1:下載火車頭采集軟件,新建站點(diǎn)-新建任務(wù)后-點(diǎn)擊發(fā)布按扭,在彈出來(lái)的窗口左邊按添加彈出添加web發(fā)布配置,選擇導(dǎo)入模塊,選中你剛才解壓到本地的那個(gè)phpcms9 文章免登陸發(fā)布模塊.cwr文件,導(dǎo)入后,列表框里就會(huì)顯示你剛才導(dǎo)入的模塊,選中他,然后點(diǎn)擊左邊的查看/修改按鈕,然后會(huì)彈出火車頭采集器-WEB在線發(fā)布模塊編輯器,在刷新列表設(shè)置里把驗(yàn)證密碼改為你之前在接口文件的驗(yàn)證碼一致即/jiekou_gbk.php?pw=123456中的123456,另外要注意,好多的人發(fā)布不成功,這一步有一點(diǎn)很重要,就是你改了接口文件的名,這里的接口文件一定也要跟著改,即你上傳到網(wǎng)站根目錄的接口文件和/jiekou_gbk.php一致才可以.
2:文章發(fā)表參數(shù)里:把/jiekou_gbk.php?m=content&c=content&a=add&&pw=123456,改為了和你的接口文件一致(文件名和驗(yàn)證密碼)
3:在自動(dòng)發(fā)布數(shù)據(jù)包里,找到-----------------------------7dlocoyspider
Content-Disposition:?form-data;?name='info[paginationtype]'
0 ?--phpfensi.com
-----------------------------7dlocoyspider
Content-Disposition:?form-data;?name='info[maxcharperpage]'
10000
把這里的0改為了2,即為手動(dòng)發(fā)布,然后10000這里改為你想多少個(gè)字符就換頁(yè),根據(jù)實(shí)際需求,自己填寫(xiě),在使用接口文件,支持變換用戶名這里打勾,在列表文件里真寫(xiě)你自己網(wǎng)站已有的會(huì)員名,注意,必須是你CMS里已經(jīng)有的會(huì)員名才有效,改完后保存模塊,覆蓋了保存退出.
四:返回火車頭采集器主界面:點(diǎn)擊編輯任務(wù),在第二步采集內(nèi)容規(guī)則里面,點(diǎn)擊內(nèi)容標(biāo)簽進(jìn)去,把該標(biāo)簽在分頁(yè)中匹配這個(gè)勾勾上,不然你可能采集不到分頁(yè),確定后返回第二步,在左下角的分頁(yè)內(nèi)容合并連接代碼中填入:[page][/page],更新后,火車頭采集這方面就算大功告成了.
五:修改PHPCMS V9的form.inc.php文件,具體位置在:\phpcms\modules\content\fields\pages中,調(diào)整18.19.20行的順序,即把 '.L('page_type3').'這一行放在三行的第一位位置,意思是默認(rèn)為手動(dòng)分頁(yè),保存后,采集后的文章就可以按照你剛才在火車頭采集器設(shè)置的字?jǐn)?shù)進(jìn)行分頁(yè)了.
總結(jié)
以上是生活随笔為你收集整理的火车头分页post php,轻松搞定PHPCMS V9火车头采集自动分页的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 大数据领域的性能测试Benchmark介
- 下一篇: php 时间微秒,PHP中使用微秒计算脚