日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

爬虫404如何跳过_网站改版之后的一次思考:网站改版会让网站受伤?我们如何让他不降反升...

發(fā)布時間:2025/3/19 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 爬虫404如何跳过_网站改版之后的一次思考:网站改版会让网站受伤?我们如何让他不降反升... 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

作為公司官網(wǎng),一成不變是不可能的,為了適應(yīng)市場變化和公司決策要求,會經(jīng)常進(jìn)行小范圍修改,甚至大結(jié)構(gòu)和底層調(diào)整。

作為一個網(wǎng)站運(yùn)營人員很擔(dān)心因?yàn)榫W(wǎng)站改版造成網(wǎng)站收錄下降,排名降低,我們?nèi)绾螜?quán)衡利弊和規(guī)避風(fēng)險?如何讓搜索引擎認(rèn)為這次改版我很喜歡,接下來我們聊下怎么讓它愛上我們的改版。

網(wǎng)站改版之后,相對之前百度索引量增加了3000(來源:百度站長)

比如我們有個美女朋友小云,她平時喜歡化妝,由于妝容好看,讓人心曠神怡,大家都喜歡這樣美麗的小云,但是小云有一天對自己的鼻子不滿意了,她想去韓國。好,我們先暫停下。這里有個問題,整容是有風(fēng)險的,失敗了怎么辦?可能還沒有當(dāng)前好看,也可能變得更美麗。所以這里就有一個賭的成分存在。如何讓贏口更大呢,那就是花大價錢,找更專業(yè)和口碑更好的整容機(jī)構(gòu)來進(jìn)行。做好一切失敗的預(yù)案,在確保成功率95%以上時,小云踏上了韓國之旅。

小云前期準(zhǔn)備的比較充足,醫(yī)生也很專業(yè),后期保養(yǎng)很到位,小云的鼻子比原來更挺,襯托整個臉都更加立體和美麗。這是一次成功的整型手術(shù)。讓小云的美麗加分很多,吸引了更多人的關(guān)注。

反之如果小云前期并沒有思考那么多,愛美的沖動超越了一切,拿起錢直奔韓國,找了一家宣傳很好價格打到骨折的就開始了變美手術(shù),那么會這么順利嗎?可能回來之后大家輕則背后議論嘲笑,重則人都不認(rèn)識了。

放到我們網(wǎng)站上亦是如此,每次網(wǎng)站大的改版都相當(dāng)于一次整容,改的好,搜索引擎更加喜愛,隔三差五來一次,畢竟愛美之心人皆有之,爬蟲也不例外。

改的不好,給搜索引擎設(shè)立了很多障礙,爬這個不允許,爬那個進(jìn)不去。小爬蟲此時的心情非常糟糕,感覺這個網(wǎng)站已經(jīng)不歡迎我了。扭頭走掉,爬蟲回去之后打開曾經(jīng)抓取的頁面,想回憶下曾經(jīng)你們在一起的美好,發(fā)現(xiàn)很多打不開了,什么???做事情怎么能這么絕情?經(jīng)過這兩次傷害,小爬蟲心灰意冷,萬念俱灰之下計劃展開報復(fù)。首先和你劃清界限,不去你這里了,其次將你們曾經(jīng)的美好都扔到垃圾桶,不想在看到,也不讓別人看到。并且把你的信息扔到了小灰盒里,短時間不想搭理你,等你什么時候知道錯了,改正了,求抱抱了,再過來和你一起玩兒。

ok,我們現(xiàn)在大概知道小爬蟲的想法了,小爬蟲喜歡什么樣的網(wǎng)站呢?如何基于小爬蟲的喜愛來進(jìn)行網(wǎng)站的改版迭代呢?

第一、網(wǎng)站結(jié)果邏輯清晰,引導(dǎo)路徑明了

無論什么網(wǎng)站邏輯結(jié)構(gòu)是基礎(chǔ),就是主次分明,主要的內(nèi)容放置在導(dǎo)航,次要內(nèi)容放置二級導(dǎo)航或者二級頁面,依次類推,這里重點(diǎn)說下H標(biāo)簽,H標(biāo)簽是為了突出重點(diǎn)而存在,爬蟲來到我們的頁面時也是優(yōu)先看下這個頁面的H1標(biāo)簽是什么意思,然后斷定這個頁面的主旨意思,進(jìn)而做主詞提取和映射分類。

所以這里需要特別注意的就是,一個頁面我們有且僅有一個H1標(biāo)簽,切記不可亂用,H1濫用的后果就是,爬蟲來到一個頁面不知道到底要表達(dá)什么意思,出現(xiàn)理解混亂,輕者隨意指定一個詞,重者按照非標(biāo)準(zhǔn)頁面不予收錄,不管是哪一個都不是我們期望的結(jié)果,所以還是要有層次的使用H標(biāo)簽,切勿亂用。

大家可能會問了,H1不可亂用H2我是不是可以任意妄為?No,H2標(biāo)簽雖然沒有H1標(biāo)簽?zāi)敲疵舾?#xff0c;沒有講究唯一性,但是也不是隨便什么內(nèi)容都可以使用H2,我們有的工程師甚至有吧H2標(biāo)簽當(dāng)成加粗字體來使用的,恐怖如斯啊,H2標(biāo)簽存在的意義是次要標(biāo)題,比如一個文章列表頁,主標(biāo)題可能是分類的名稱,次要標(biāo)題應(yīng)該是分類下的文章名稱。而不是什么相關(guān)文章也可以使用H2標(biāo)簽。這里咱們舉個反面例子,也就他可以有這個特權(quán),做錯了事情還可以排名不受影響。

百度自家產(chǎn)品也不遵守相關(guān)規(guī)則

所以我們的頁面結(jié)構(gòu)要遵從語義上的邏輯結(jié)構(gòu),爬蟲他看到的是源碼頁面,代碼上面的邏輯清晰,它抓取的才更順利,自然抓取的內(nèi)容也是我們期望的結(jié)果。使用H標(biāo)簽時要按照層級來使用。

第二、URL不要變,如果要變,一定要做好301跳轉(zhuǎn)

這個是蜘蛛找到我們的路徑,也是蜘蛛索引的地址,非常不建議再改版網(wǎng)站時把地址也改掉了,但是也有原來的地址不符合閱讀習(xí)慣或者不合適的情況,既然要變,切記要做好記錄,哪些地址變了,舊地址是什么,新地址是什么做一個對比表,在Nginx上面做好301映射,防止蜘蛛迷路。

如果改版的地址是永久性質(zhì),一定要使用301跳轉(zhuǎn),不要使用302,302是臨時跳轉(zhuǎn),搜索引擎對這個返回持保留意見,并不會丟棄舊地址而301就是告訴搜索引擎,我永久使用這個地址,請丟棄舊的。

盡量使用服務(wù)端跳轉(zhuǎn),比如在Nginx或者服務(wù)器端配置跳轉(zhuǎn),不要在頁面上使用meta或者js實(shí)現(xiàn)。

第三、埋點(diǎn)監(jiān)測,配合熱圖了解用戶行為偏好,驗(yàn)證改版是否符合預(yù)期

AB測試是貫穿我們網(wǎng)站運(yùn)營始終的存在,我們每一次改變應(yīng)該有數(shù)據(jù)支撐,依靠數(shù)據(jù)來做結(jié)果判斷,不要一味的相信自己的經(jīng)驗(yàn)。

比如我們都堅信周末時間是休息日,大家使用TOB產(chǎn)品的頻次較低,轉(zhuǎn)化一般不高,但是事實(shí)證明,周末兩天的轉(zhuǎn)化率高于平時。

周六周日的轉(zhuǎn)化率高于平時(來源:易觀方舟)

運(yùn)營應(yīng)該以數(shù)據(jù)為準(zhǔn),用數(shù)據(jù)說話,避免經(jīng)驗(yàn)主義,這樣才能讓每次改版或者優(yōu)化有結(jié)果反饋。我們在昨晚改版之后,應(yīng)該以一周為周期,來觀察我們的改版是否符合預(yù)期,用戶使用路徑是否得到了改善,是否提升了客戶留資率和訪問率。

第四、站長平臺提交改版規(guī)則,如果只是改頁面,沒有修改URL地址,則不用去提交。目的就是加快百度對新地址收錄。

打個比方,我們有一家店面,現(xiàn)在由于業(yè)務(wù)擴(kuò)張,要喬遷新址,可是百度地圖還是記錄我們老的地址,為了讓客戶能及時找到我們,會在百度地圖請求更新地址。

因?yàn)榘俣鹊刂犯孪鄬?#xff0c;主動提交就可以提升效率,我們在百度平臺提交改版規(guī)則就是這個目的,主動提醒搜索引擎我們做了改變,新地址是什么。

第五、如果是做了一個新網(wǎng)站,結(jié)構(gòu)和域名都變了,切記要保留老網(wǎng)站一段時間,半年時間為佳,保證蜘蛛能正常訪問,慢慢向新網(wǎng)站導(dǎo)流。

這里有一個技巧,如果可以的話老站和新站部署兩套,老站增加新站入口,讓用戶和搜索引擎有個適應(yīng)期。這樣能充分保持索引就算新站效果不好,老站還可以頂一頂。如果網(wǎng)站不好這樣操作,則記得去百度站長平臺進(jìn)行提交改版規(guī)則。

單事與愿違,有的網(wǎng)站本身比較耗費(fèi)資源,部署兩套環(huán)境對硬件資源消耗較大,最好的方案是官網(wǎng)盡量部署兩套,就是純文本資源和產(chǎn)品體驗(yàn)功能剝離開,盡量保證舊的索引存在一段時間,如果這個也無法實(shí)現(xiàn),那么切記統(tǒng)計好所有頁面和新頁面的對應(yīng)關(guān)系,做一個詳細(xì)的改版規(guī)則提交給搜索引擎。

第六:頁面Title和Description能不變就不要改變,如果迫不得已真的想改,那就一次改到位,不要零零散散的改,經(jīng)常變動會影響蜘蛛對網(wǎng)站的判斷,降權(quán)比較厲害。

這里多說兩句,因?yàn)樽约涸?jīng)踩過坑,當(dāng)時為了讓首頁排名靠前,首頁上的關(guān)鍵詞想盡可能使用流量比較大的詞,當(dāng)時沒有確定用哪個,差不多1天改一次,反反復(fù)復(fù)這樣折騰了一周,最后發(fā)現(xiàn)原來排名靠前的關(guān)鍵詞也掉到了第二頁之后,當(dāng)時不知道原因,以為是改動網(wǎng)站頁面結(jié)構(gòu)導(dǎo)致的,因?yàn)槟且恢芨膭哟_實(shí)太頻繁,后來看快照發(fā)現(xiàn)快照是新的,那證明收錄正常,排名下降只能說明權(quán)重受到了影響,當(dāng)時想的可能是標(biāo)題改動導(dǎo)致的,停了將近2周時間,排名才恢復(fù)。所以改標(biāo)題一定要慎重。

第七:404頁面一定要設(shè)置好,404頁面盡量設(shè)計一個好看一點(diǎn),如果出現(xiàn)無法訪問的頁面,做好客戶引導(dǎo),將客戶引導(dǎo)到首頁或者欄目頁,不要讓客戶真正的走丟。

網(wǎng)絡(luò)搜索一下個性404頁面,很多參考,404本身是一個不怎么友好的存在,對用戶好感度是一個很大的消耗,如果設(shè)計好看,正好可以中和下用戶的反感,同時告訴用戶找不到當(dāng)前資源還可以做什么,比如放一個搜索框或者文字鏈接引導(dǎo)到首頁等等,盡最大努力留住客戶是我們的目的。

上面主要列舉了一些改版中應(yīng)該注意的點(diǎn),落實(shí)的好將會讓我們網(wǎng)站改版的傷害降到最低,雖然改版對網(wǎng)站收錄有風(fēng)險,但是操作的好利大于弊,新網(wǎng)站一定是符合用戶習(xí)慣和搜索引擎的,不然改版的意義就不存在,所以利用搜索引擎對我們重新審視的這個期限,我們應(yīng)該保持初心,定時定量輸出優(yōu)質(zhì)內(nèi)容。讓搜索引擎對我們的好感度持續(xù)保鮮。

總結(jié)

以上是生活随笔為你收集整理的爬虫404如何跳过_网站改版之后的一次思考:网站改版会让网站受伤?我们如何让他不降反升...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。