php抓取aspx_哪些因素会影响蜘蛛抓取页面?
我們在優(yōu)化網(wǎng)站時(shí),有很多設(shè)置是不利于蜘蛛抓取的,具體有哪些呢?
建設(shè)網(wǎng)站地圖
網(wǎng)站地圖就像一個(gè)指向標(biāo),唯有清晰明了的指向標(biāo),才能指引蜘蛛抓取的路線。如果網(wǎng)站地圖清晰明了,蜘蛛很樂意在網(wǎng)站進(jìn)行爬行。但是如果網(wǎng)站內(nèi)部鏈接一團(tuán)亂,蜘蛛進(jìn)來后經(jīng)常迷路,那么下次蜘蛛很少過來,對網(wǎng)站的抓取很不利。
登錄設(shè)置
有些網(wǎng)站會(huì)設(shè)置注冊賬號(hào)的服務(wù),登錄之后才能看到網(wǎng)站的內(nèi)容,這種設(shè)置對于蜘蛛來說不友好,蜘蛛它也不會(huì)注冊登錄,自然就抓取不到了。
動(dòng)態(tài)URL
所謂動(dòng)態(tài)URL就是在鏈接中“?”同時(shí)以aspx、asp、jsp、perl、php、cgi為后綴的url,便是動(dòng)態(tài)URL,動(dòng)態(tài)URL的變動(dòng)性較大,不如靜態(tài)URL穩(wěn)定,搜索引擎一般對動(dòng)態(tài)URL不夠信任,從而使很多動(dòng)態(tài)URL的網(wǎng)頁不能被收錄。
網(wǎng)站的結(jié)構(gòu)
一個(gè)網(wǎng)站的結(jié)構(gòu)不僅影響著用戶的體驗(yàn)度,對整個(gè)網(wǎng)站的優(yōu)化也是有著至關(guān)重要的作用,而符合百度蜘蛛抓取的網(wǎng)站首先要簡單明了,層次分明,這樣會(huì)大大的提升網(wǎng)站對蜘蛛的可讀性。
網(wǎng)站的外部鏈接
要被蜘蛛抓取,就必須有導(dǎo)入鏈接進(jìn)入頁面,否則蜘蛛根本沒有機(jī)會(huì)知道頁面的存在。外部鏈接的添加一定要謹(jǐn)慎,不能為了外鏈的數(shù)量而忽略質(zhì)量。不好的外鏈,還會(huì)連累自身網(wǎng)站的抓取,因此網(wǎng)站進(jìn)行外部鏈接時(shí),一定要定時(shí)對外部鏈接進(jìn)行檢查和更新。
網(wǎng)站跳轉(zhuǎn)
有些網(wǎng)站打開之后就會(huì)自動(dòng)跳轉(zhuǎn)到其他的頁面,跳轉(zhuǎn)會(huì)增加網(wǎng)站加載的時(shí)間,不推薦大家這樣做,只做301跳轉(zhuǎn)就可以了,301跳轉(zhuǎn)可以進(jìn)行權(quán)重的集中,其他類型的調(diào)整不建議做。
總結(jié)
以上是生活随笔為你收集整理的php抓取aspx_哪些因素会影响蜘蛛抓取页面?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 顺序执行_执行流程 | 你真的了解Spr
- 下一篇: php 工厂静态类,静态工厂模式(Sta