搜索引擎反作弊之:链接作弊与隐藏作弊
??????????????? ? ? ? ? ? ?? 本文節(jié)選自《這就是搜索引擎:核心技術詳解》第八章
8.2 鏈接作弊
? ?? 所謂“鏈接作弊”,是網站擁有者考慮到搜索引擎排名中利用了“鏈接分析”技術,所以通過操縱頁面之間的鏈接關系,或者操縱頁面之間的鏈接錨文字,以此來增加鏈接排序因子的得分,并影響搜索結果排名的作弊方法。常見的鏈接作弊方法眾多,此節(jié)簡述幾種比較流行的作弊方法。
?
1.鏈接農場(Link Farm)
?????? 為了提高網頁的搜索引擎鏈接排名,“鏈接農場”構建了大量互相緊密鏈接的網頁集合,期望能夠利用搜索引擎鏈接算法的機制,通過大量相互鏈接來提高網頁排名?!版溄愚r場”內的頁面鏈接密度極高,任意兩個頁面都可能存在互相指向鏈接。圖8-2展示了一個精心構建的鏈接農場。
???????????????
???????????? ???????????圖8-2 鏈接農場
??????
?
2.Goolge 轟炸(Google Bombing)
????? “錨文字”是指向某個網頁的鏈接描述文字,這些描述信息往往體現(xiàn)了被指向網頁的內容主題,所以搜索引擎往往會在排序算法中利用這一點。
????? 作弊者通過精心設置錨文字內容來誘導搜索引擎給予目標網頁較高排名,一般作弊者設置的錨文字和目標網頁內容沒有什么關系。
????? 幾年前曾經有個著名例子,采用“Google轟炸”來操控搜索結果排名。當時如果用Google搜索“miserable failure”,會發(fā)現(xiàn)排在第二位的搜索結果是美國時任總統(tǒng)小布什的白宮頁面,這就是通過構建很多其它網頁,在頁面中包含鏈接指向目標頁面,其鏈接錨文字包含 “miserable failure”(參考圖8-3和圖8-4)。通過這種方式就導致了人們看到的搜索結果。
?
? ??????????? ??????????????????????
?????????????????????????????? 圖8-3 ?Google轟炸的原理
?
????????????? ?????
?????????????????????????? 圖8-4 ?Google轟炸后的效果
?
3.交換友情鏈接
??? 作弊者通過和其它網站交換鏈接,相互指向對方的網頁頁面,以此來增加網頁排名。很多作弊者過分地使用此種手段,但是并不意味這使用這個手段的都是作弊網站,交換友情鏈接的做法也是正常網站的常規(guī)措施。
?
4.購買鏈接
???? 有些作弊者會通過購買鏈接的方法,即花錢讓一些排名較高的網站的鏈接指向自己的網頁,以此提高網站排名。
?
5.購買過期域名
?? 有些作弊者會購買剛剛過期的域名,因為有些過期域名本身的PageRank排名是很高的,通過購買域名可以獲得高價值的外鏈。
?
6.“門頁”作弊(Doorway Pages)
???? “門頁”本身不包含正文內容,而是由大量鏈接構成,而這些鏈接往往會指向同一網站內的頁面,作弊者通過制造大量的“門頁”來提升網站排名。
?
?
8.3 頁面隱藏作弊
? ??“頁面隱藏作弊”通過一些手段瞞騙搜索引擎爬蟲,使得搜索引擎抓取的頁面內容和用戶點擊查看到的頁面內容不同,以這種方式來影響搜索引擎的搜索結果。常見的頁面隱藏作弊方式有:
1.????? IP地址隱形作弊(IP Cloaking)
?????? 網頁擁有者在服務器端記載搜索引擎爬蟲的IP地址列表,如果發(fā)現(xiàn)是搜索引擎在請求頁面,則會推送給爬蟲一個偽造的網頁內容,而如果是其它IP地址,則會推送另外的網頁內容,這個頁面往往是有商業(yè)目的的營銷頁面。
2.????? HTTP請求隱形作弊(User agent Cloaking)
??????? 客戶端和服務器在獲取網頁頁面的時候遵循HTTP協(xié)議,協(xié)議中有一項叫做“用戶代理項”(user agent)。搜索引擎爬蟲往往會在這一項有明顯的特征(比如Google爬蟲此項可能是:Googlebot/2.1),服務器如果判斷是搜索引擎爬蟲則會推送和用戶看到的不同的頁面內容。
????? 圖8-5是一個HTTP請求隱藏作弊的例子,作弊網站服務器推送給搜索引擎爬蟲的頁面是講述減肥食品的內容,而推送給頁面訪問者的則是減肥產品銷售推廣頁面。這樣當用戶在搜索減肥知識的時候就會直接訪問減肥產品頁面,從而達到作弊者的商業(yè)目的。
??????? ???????????????
????????????????????????? 圖8-5 ?HTTP請求隱藏作弊
?
3.????? 網頁重定向
?????? 作弊者使得搜索引擎索引某個頁面內容,但是如果是用戶訪問則將頁面重定向到一個新的頁面。
????????
4.頁面內容隱藏
???? 通過一些特殊的HTML標簽設置,將一部分內容顯示為用戶不可見,但是對于搜索引擎來說是可見的。比如設置網頁字體前景色和背景色相同,或者在CSS中加入不可見層來隱藏頁面內容。將隱藏的內容設置成一些與網頁主題無關的熱門搜索詞,以此增加被用戶訪問到的概率。
總結
以上是生活随笔為你收集整理的搜索引擎反作弊之:链接作弊与隐藏作弊的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 搜索引擎索引之如何更新索引
- 下一篇: 搜索引擎反作弊之:整体技术思路