日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) >

最大化参数 火车头_火车头采集器菜鸟使用手册

發(fā)布時(shí)間:2023/12/8 40 豆豆
生活随笔 收集整理的這篇文章主要介紹了 最大化参数 火车头_火车头采集器菜鸟使用手册 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

《火車頭采集器菜鳥(niǎo)使用手冊(cè)》由會(huì)員分享,可在線閱讀,更多相關(guān)《火車頭采集器菜鳥(niǎo)使用手冊(cè)(36頁(yè)珍藏版)》請(qǐng)?jiān)谌巳宋膸?kù)網(wǎng)上搜索。

1、www.okyanli.com OK眼力 精準(zhǔn)分享論壇火車頭 采集教程火車頭采集器使用說(shuō)明下載地址:http:/www.okyanli.com/forum.php?mod=viewthread&tid=4&extra=下載地址:http:/www.locoy.com/Down/ 我們下載免費(fèi)版。注意:想用火車,就必須得安裝.NET FrameWork 2.0框架或更高版本.net framework 2.0下載地址: 那么,火車我們也下載到本地了,。net框架,我們也安裝了。那么,我們把新下載的火車采集軟件,解壓下。看到一些密密麻麻亂七八糟的東西及文件。那么。上圖中,用紅線圈住的LocoySp。

2、ider.exe 是主程序,我們雙擊打開(kāi)。ps:這里說(shuō)下,上圖中,有好多任務(wù)是我自己用的。新程序,并沒(méi)有那么多。我們會(huì)看到火車的界面,看起來(lái)非常復(fù)雜,是吧? 呵呵,其實(shí)并沒(méi)有那么復(fù)雜,對(duì)于新手,有好多東西是用不到的。下邊會(huì)一一的講解。我們先補(bǔ)習(xí)一下,火車頭采集軟件的工作原理。因?yàn)槲覀優(yōu)g覽到的網(wǎng)頁(yè),最后都是通過(guò)html輸出的,那么意味著,我們可以查看到html的源碼,那么火車頭為什么會(huì)采集到內(nèi)容呢?我們看下網(wǎng)站的基本結(jié)構(gòu)。-這些藍(lán)色的東西,對(duì)于新手,我們不需要知道!網(wǎng)頁(yè)的標(biāo)題 -紅色的是網(wǎng)頁(yè)的標(biāo)題。如下圖(1)內(nèi)容 在這個(gè)和之間的,是網(wǎng)站的內(nèi)容部分。如下圖(2)-這里是網(wǎng)站的結(jié)尾。如果想查看一個(gè)。

3、網(wǎng)頁(yè)的html源文件,之需要點(diǎn)擊瀏覽器上的 查看,源文件即可。(1)(2)那么,我們知道了一個(gè)網(wǎng)頁(yè)最基本的架構(gòu),那么就好理解火車采集的基本原理了火車采集軟件是怎么采集的呢?我們配置好火車頭采集規(guī)則,什么叫采集規(guī)則?就是我們查看網(wǎng)頁(yè)的源文件,看看整個(gè)網(wǎng)頁(yè)的源碼,內(nèi)容部分的開(kāi)始標(biāo)簽,和結(jié)束標(biāo)簽,這樣火車才能知道,我們要采集這個(gè)頁(yè)面的哪個(gè)部分,比如下邊我們演示的。網(wǎng)頁(yè)的標(biāo)題內(nèi)容我們想要采集“內(nèi)容”那么就要告訴火車采集器,內(nèi)容開(kāi)始標(biāo)簽是,結(jié)束標(biāo)簽就是明白了么?呃。估計(jì)是我的表達(dá)能力不夠好。so。我們看下邊的實(shí)例,在好好鞏固下就OK。OK。那么我們開(kāi)始一步一步教大家設(shè)置采集規(guī)則。首先第一個(gè)。我們的目標(biāo)站。

4、。discuz!x1.5架構(gòu)的網(wǎng)站。http:/www.yq90.cn/forum-60-1.html我們要把這個(gè)版塊的內(nèi)容以及回復(fù)都采集到我們的網(wǎng)站上去。首先我們打開(kāi)火車,新建一個(gè)站點(diǎn)。點(diǎn)擊火車左上角上的新建按鈕,選擇新建站點(diǎn)。如下圖我們只需要填寫(xiě)站點(diǎn)名就可以,其余的保持默認(rèn),然后點(diǎn)擊保存按鈕!然后。在這個(gè)站點(diǎn)下,新建一個(gè)任務(wù)。選中我們新建的站點(diǎn),點(diǎn)擊鼠標(biāo)右鍵,選擇第一個(gè),從該站點(diǎn)新建任務(wù)。如下圖其中1,是任務(wù)的名字,必須填寫(xiě)。2,是整個(gè)采集任務(wù)的步驟向?qū)?#xff0c;3,是文章列表的設(shè)置區(qū)域(下邊講解),4,和3差不多。5,是登錄的地方,有些網(wǎng)址必須登錄,我們才可以看到內(nèi)容,就是這個(gè)東西!OK。就這些。

5、,那么,我們一步一步的來(lái)!首先我們給我們的任務(wù)加一個(gè)標(biāo)題。下一步,我們就開(kāi)始設(shè)置列表的采集規(guī)則(因?yàn)楝F(xiàn)在火車不知道 http:/www.yq90.cn/forum-60-1.html 這個(gè)頁(yè)面的文章列表是那些,所以我們要告訴火車!)這里有兩種方式,新手嘛,我也不知道適合哪種。我們就用默認(rèn)的吧,第一種我們點(diǎn)擊向?qū)砑尤缓蟪霈F(xiàn)下圖。其中有4個(gè)選項(xiàng)卡,如果我們只采集目標(biāo)站點(diǎn)的一個(gè)文章列表http:/www.yq90.cn/forum-60-1.html,那么我們選中單條網(wǎng)址,直接寫(xiě)上目標(biāo)的列表網(wǎng)站,如下圖!然后點(diǎn)擊添加,點(diǎn)擊完成就OK。那么,如果我們要采集多個(gè)列表。那么我們回到 看下邊的圖其中1,是。

6、目標(biāo)網(wǎng)站的地址其中2,是火車的通配符(就是某個(gè)東西識(shí)別的東西)其中3,是間隔數(shù)已經(jīng)補(bǔ)零(下邊一一講解)其中4,數(shù)字變化。下邊講解其中5,字母變化。那么。看下圖圖中在地址欄填寫(xiě)的是 http:/www.yq90.cn/forum-60-(*).html 這個(gè)。那么,這是什么意思呢? 我們打開(kāi) http:/www.yq90.cn/forum-60-1.html 這個(gè)地址,然后點(diǎn)擊下一頁(yè)發(fā)現(xiàn)地址變成了 http:/www.yq90.cn/forum-60-2.html 那么我們?cè)邳c(diǎn)擊下一頁(yè),就是第三頁(yè),發(fā)現(xiàn)地址變成了 http:/www.yq90.cn/forum-60-3.html 那么在點(diǎn)擊第四。

7、頁(yè)。想必大家也知道變成什么了吧? 那么第一頁(yè):http:/www.yq90.cn/forum-60-1.html第二頁(yè):http:/www.yq90.cn/forum-60-2.html第三頁(yè):http:/www.yq90.cn/forum-60-3.html翻頁(yè)中,我們發(fā)現(xiàn),只有1在變化。那么我們?cè)诨疖嚹抢锞吞顚?xiě)http:/www.yq90.cn/forum-60-(*).html 這個(gè),其中1用火車的通配符(*)替換掉。意思就是,只有1在變化。在看下邊其中數(shù)字變化,從1到5.意思就是 從地址欄 http:/www.yq90.cn/forum-60-(*).htm獲取地址 1到5,就是下邊這。

8、樣的。http:/www.yq90.cn/forum-60-1.htmlhttp:/www.yq90.cn/forum-60-2.html。http:/www.yq90.cn/forum-60-5.html明白了么?其實(shí)很簡(jiǎn)單。那么字母變化,就是 http:/www.yq90.cn/forum-60-a.htmlhttp:/www.yq90.cn/forum-60-b.html。http:/www.yq90.cn/forum-60-z.html因?yàn)槲覀兡繕?biāo)地址是數(shù)字變化。我們繼續(xù)看下邊間隔倍數(shù),和補(bǔ)零。間隔倍數(shù)1是什么意思?40又是什么意思呢?間隔倍數(shù)1就是http:/www.yq90.cn/。

9、forum-60-1.htmlhttp:/www.yq90.cn/forum-60-2.html。http:/www.yq90.cn/forum-60-5.html間隔倍數(shù)40就是http:/www.yq90.cn/forum-60-40.htmlhttp:/www.yq90.cn/forum-60-80.html。http:/www.yq90.cn/forum-60-200.html明白了么?那么我們?cè)诳囱a(bǔ)零,補(bǔ)零就是。http:/www.yq90.cn/forum-60-01.htmlhttp:/www.yq90.cn/forum-60-02.html。http:/www.yq90.cn/。

10、forum-60-05.html就是這樣。其實(shí)很好理解。OK。我們繼續(xù)。我們填寫(xiě)完成后,點(diǎn)擊添加 - 完成。如下圖到這里,我們的地址就添加完成了。那么下邊,我們來(lái)設(shè)置區(qū)域列表。我們先設(shè)置第一個(gè)。“文章內(nèi)容頁(yè)面地址必須包含。不得包含。”我們隨便點(diǎn)開(kāi)http:/www.yq90.cn/forum-60-1.html 這個(gè)網(wǎng)址中的兩篇文章,看下URL。就是文章地址。http:/www.yq90.cn/thread-88312-1-1.htmlhttp:/www.yq90.cn/thread-88373-1-1.html發(fā)現(xiàn)以上兩個(gè)地址。那么他們其中只有 http:/www.yq90.cn/threa。

11、d-88373-1-1.html 紅色部分在變動(dòng)。那么,文章內(nèi)容必須包含。我們寫(xiě) http:/www.yq90.cn/thread-(*)-(*)-(*).html 這樣就可以,那么我們點(diǎn)擊“開(kāi)始測(cè)試網(wǎng)址采集”這個(gè)時(shí)候,我們點(diǎn)開(kāi)網(wǎng)站前邊的+號(hào)發(fā)現(xiàn),其實(shí)網(wǎng)址已經(jīng)采集成功了。其中的并不需要填寫(xiě)。這是為什么呢?因?yàn)槲覀儾杉捻?yè)面 http:/www.yq90.cn/forum-60-1.html 中的文章地址,就是 http:/www.yq90.cn/thread-88373-1-1.html這樣的地址,至于為什么要寫(xiě)成http:/www.yq90.cn/thread-(*)-(*)-(*).htm。

12、l這樣,是因?yàn)槠渲械膆ttp:/www.yq90.cn/thread-88373-1-1.html 紅色部分都會(huì)變動(dòng)。或者有可能變動(dòng)。所以我們加上通配符,所以我們不用填寫(xiě)這個(gè),也可以采集成功。那么,為了讓大家更直白的了解火車,我們還是寫(xiě)一下。那么我們打開(kāi) http:/www.yq90.cn/forum-60-1.html 這個(gè)地址,在頁(yè)面中,點(diǎn)擊右鍵,選擇“查看源文件”(因?yàn)椴缓媒貓D。)發(fā)現(xiàn)上邊的東西出現(xiàn),都是一些猥瑣的html代碼。我們?cè)趺炊x文章地址的區(qū)域呢?看下圖我們復(fù)制頁(yè)面中的“篩選”然后在頁(yè)面源碼中查找下,那么自然,下邊的,就是文章地址的區(qū)域咯。那么我們?cè)谶@里,填寫(xiě)什么呢?我們要填寫(xiě)。

13、一個(gè)“唯一”的東西。就是這個(gè)頁(yè)面獨(dú)有的一個(gè),并且在文章地址上方的一個(gè)代碼。如上圖。我們選擇這段 代碼!然后我們復(fù)制 這段代碼,在我們打開(kāi)的源文件中,向下查找看,看看有沒(méi)有相同的。好消息。沒(méi)有相同了。那么我們?cè)谔顚?xiě) 那么這里怎么填寫(xiě)呢?其實(shí)一樣。我們給下看看源碼。我們向上查找下。OK.那么。就填寫(xiě).就OK。照著這樣填寫(xiě)就OK了。其實(shí)這一步是多此一舉。只是教大家怎樣填寫(xiě)罷了。我們隨便選中一條地址,雙擊鼠標(biāo)左鍵。直接跳到第二部,采集內(nèi)容規(guī)則。在這里,我們點(diǎn)擊一下測(cè)試按鈕。發(fā)現(xiàn),標(biāo)題和內(nèi)容都采集到了,但是。在標(biāo)題上,我們把目標(biāo)站點(diǎn)的網(wǎng)站主標(biāo)題也采集過(guò)來(lái)了。而內(nèi)容。是把整個(gè)頁(yè)面亂七八糟的東西都采集過(guò)來(lái)了。

14、。那么。我們開(kāi)始設(shè)置更精確的采集規(guī)則。擦。首先,我們?cè)O(shè)置標(biāo)題。現(xiàn)在默認(rèn)的采集標(biāo)題是 又出來(lái)個(gè)史上最強(qiáng)大的搜索引擎! - 無(wú)聊扯蛋 - 張家口市姚家房鎮(zhèn)及周邊地方娛樂(lè)門戶站 - Powered by Discuz! 我們需要的標(biāo)題是紅色部分。那么。 我們雙擊上圖被圈住的地方。那么我們需要設(shè)置的地方就是那么。我們現(xiàn)在采集到的標(biāo)題是 又出來(lái)個(gè)史上最強(qiáng)大的搜索引擎! - 無(wú)聊扯蛋 - 張家口市姚家房鎮(zhèn)及周邊地方娛樂(lè)門戶站 - Powered by Discuz! 這個(gè),那么,我們只需要把藍(lán)色的部分去掉。怎么去掉呢?下圖我們添加然后點(diǎn)擊確定點(diǎn)擊測(cè)試發(fā)現(xiàn)又出來(lái)個(gè)史上最強(qiáng)大的搜索引擎! - 無(wú)聊扯蛋 - 張。

15、家口市姚家房鎮(zhèn)及周邊地方娛樂(lè)門戶站 - Powered by Discuz! 藍(lán)色部分已經(jīng)被去掉。那么我們這里來(lái)解釋下。上圖中的開(kāi)始字符串和結(jié)束字符串是什么呢?我們打開(kāi) http:/www.yq90.cn/thread-88389-1-2.html 這個(gè)頁(yè)面,然后查看下源文件。如下圖。可以發(fā)現(xiàn),在和中就是我們要采集文章的標(biāo)題,只是多了- 無(wú)聊扯蛋 - 張家口市姚家房鎮(zhèn)及周邊地方娛樂(lè)門戶站 - Powered by Discuz! 這個(gè),那么我們排除就可以了。那為什么在中,要寫(xiě)成- (*) - 張家口市姚家房鎮(zhèn)及周邊地方娛樂(lè)門戶站 - Powered by Discuz!這樣的呢?為什么把 無(wú)聊。

16、扯蛋換成了(*)呢?因?yàn)槲覀兛梢钥吹贸? 無(wú)聊扯蛋 - 張家口市姚家房鎮(zhèn)及周邊地方娛樂(lè)門戶站 - Powered by Discuz! 無(wú)聊扯蛋 只是這個(gè)網(wǎng)站的一個(gè)版塊,如果采集別的版塊,那么 無(wú)聊扯蛋,就會(huì)變動(dòng)。到時(shí)候我們還得設(shè)置排除標(biāo)簽。索性,我們把它改成通配符(*),那么在采集別的版塊,就不用設(shè)置了。那么其中的藍(lán)色部分,是網(wǎng)站的主標(biāo)題,在一般情況下是不會(huì)變動(dòng)的。所以不用搞成通配符。 那么。標(biāo)題。我們就設(shè)置完成了。下邊來(lái)設(shè)置內(nèi)容部分。內(nèi)容部分的采集規(guī)則設(shè)置,其實(shí)和列表一樣!我們服飾內(nèi)容,在源文件進(jìn)行查找。其中選中的部分,就是我們的內(nèi)容部分。那么。我們?cè)谠创a中 查找下 這個(gè)標(biāo)簽,看看是不是唯。

17、一的。 發(fā)現(xiàn)并不是唯一的。而是每個(gè)樓層也就是回帖的內(nèi)容都是用 和 括起來(lái)的。那么。我們就輸入上圖所示。在圖中的 html標(biāo)簽排除。我們?nèi)x。因?yàn)槲覀冎蟮陌l(fā)布,是不支持發(fā)布附件的,也不支持html。所以全部排除。然后確定。我們測(cè)試下其中內(nèi)容和內(nèi)容之間,用|分割開(kāi)了。這是啥意思類?呵呵。這個(gè)是循環(huán)匹配。就是。一個(gè)樓層與樓層之間的分隔符。就是回復(fù)與回復(fù)之間的分隔符。哎呀。我也說(shuō)不清楚啦。總之。這樣就可以。默認(rèn),保持不變就OK。那么。現(xiàn)在,標(biāo)題也設(shè)置OK。內(nèi)容也OK。接下來(lái)就是分頁(yè)問(wèn)題。我們?cè)谠次募胁檎摇跋乱豁?yè)”那么圖中被選中的地方,就是下一頁(yè)的全部源碼。那么,我們選中下一個(gè)的開(kāi)始標(biāo)簽 和結(jié)束標(biāo)簽。

18、,對(duì)應(yīng)輸入到就可以了。我們?cè)诜猪?yè)內(nèi)容合并鏈接代碼這里輸入|這個(gè)。至于什么意思。就是分頁(yè)嘛。我也說(shuō)不清楚。總是輸入就是了。那么。到這里,網(wǎng)址采集部分,和內(nèi)容采集部分已經(jīng)設(shè)置完畢了。下邊,我們要講,發(fā)布。現(xiàn)在開(kāi)始講解 火車頭的發(fā)布。因?yàn)槲覀冃枰l(fā)布到 我們的 discuz!x1.5的程序上。那么,首先我們需要兩個(gè)東西1.火車頭的dz1.5的發(fā)布模塊 (塵緣免費(fèi)版)2.免登錄接口 (塵緣免費(fèi)版)那么。下載地址。http:/u.115.com/file/f2171fad7e如果下載地址失效。請(qǐng)加我QQ 索取 782711659下載后,解壓。首先呢。我們需要配置接口。我們進(jìn)入接口文件夾。并且進(jìn)入對(duì)應(yīng)編碼。

19、的文件夾發(fā)現(xiàn)有兩個(gè)php文件。 其中的 Locoy.php是程序主文件,可以改名,Locoy.config.php是配置文件,不能改名。那么我們先把Locoy.php的名字改掉。我們改成 woca.php然后我們打開(kāi)locoy.config.php 這個(gè)文件其中1,是發(fā)帖的用戶,2,是回帖的用戶。這里我們可以填寫(xiě)自己的。記得用|分開(kāi)。這里說(shuō)下,我們填寫(xiě)的用戶名,可以是網(wǎng)站沒(méi)有注冊(cè)的,也可以是注冊(cè)過(guò)的。如果沒(méi)有注冊(cè)的,它會(huì)自動(dòng)注冊(cè)。剩下其他的配置參數(shù),可以根據(jù)自己的需要更改,都有注釋,這里就不一一解釋了。更改完成后,我們把這兩個(gè)文件上傳到我們空間的根目錄。OK。接口文件我們已經(jīng)處理完畢。那么。我。

20、們開(kāi)始處理發(fā)布模塊。進(jìn)入火車。我們導(dǎo)入圈中的模塊。因?yàn)槲乙呀?jīng)導(dǎo)入過(guò)了。所以這里不用。在圖中圈住的地方。我們要修改成我們自己改的名字。如圖。記得在刷新列表那里也要修改。OK。模塊基本完成了。還有一點(diǎn)。如果我們的版塊開(kāi)啟了主題分類,那么我們還需要修改下模塊。比如我們要給維修知識(shí)里邊發(fā)。那么。發(fā)現(xiàn)主題分類的typei=1 那么我們?cè)诎l(fā)布模塊中填寫(xiě)。明白了唄? 呵呵。就這樣我們的發(fā)布模塊就配置完成了。 我們保存。給它加一個(gè)名字。然后我們關(guān)閉當(dāng)前的模塊。我們選中我們剛才修改過(guò)并且重命名的模塊。然后進(jìn)行填寫(xiě)信息。如下圖。其中1,輸入我們的網(wǎng)站地址。2,把“目標(biāo)網(wǎng)站需要登錄的溝,去掉。”3.點(diǎn)擊一下獲取列表。4,填寫(xiě)一個(gè)名字,并且保存配置在空白處,點(diǎn)擊右鍵。選擇添加更多發(fā)布配置。然后選中我們剛剛配置好的模塊!選中,點(diǎn)擊添加。記得選中啟用。下一步,我們點(diǎn)擊選擇分類選擇我們要發(fā)布的版塊。然后確定。然后保存。更新。點(diǎn)擊開(kāi)始按鈕。采集內(nèi)容列表中。采集內(nèi)容中。發(fā)布成功。偶爾有一兩個(gè)發(fā)布失敗。別管它。那是有點(diǎn)帖子內(nèi)容太少,而你的論壇設(shè)置帖子字?jǐn)?shù)的原因。Ok。

總結(jié)

以上是生活随笔為你收集整理的最大化参数 火车头_火车头采集器菜鸟使用手册的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。