日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 综合教程 >内容正文

综合教程

如何避免搜索引擎爬虫产生的流量过大以及搜索引擎设置优化

發(fā)布時(shí)間:2023/12/3 综合教程 43 生活家
生活随笔 收集整理的這篇文章主要介紹了 如何避免搜索引擎爬虫产生的流量过大以及搜索引擎设置优化 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

轉(zhuǎn)載自:http://www.qiexing.com/post/web-seach-spider.html

?

今天卻收到了虛擬主機(jī)商的報(bào)告:說(shuō)當(dāng)月流量已經(jīng)超出15G!

登錄到后臺(tái)的統(tǒng)計(jì)才發(fā)現(xiàn),正常的網(wǎng)站瀏覽產(chǎn)生的流量才1G多,而搜索引擎爬蟲(chóng)(也稱(chēng)蜘蛛:spider等)產(chǎn)生的流量卻達(dá)14G之多!有圖為證:

為什么會(huì)搜索引擎爬蟲(chóng)會(huì)產(chǎn)生這么大的流量,特別是搜狗的爬蟲(chóng)與bspider爬蟲(chóng)真是大的驚人,但卻不能為網(wǎng)站帶來(lái)流量。從統(tǒng)計(jì)中看到網(wǎng)站的大多數(shù)流量是來(lái)自百度與谷歌兩個(gè)搜索引擎,因此決定修改robots.txt文件,屏蔽其它搜索引擎爬蟲(chóng)。

從網(wǎng)上查看到的方法與格式,不知道正確與否,帖出來(lái)給大家看看,如有錯(cuò)誤請(qǐng)指正:

User-agent: Googlebot
# Directories
Disallow: /includes/
Disallow: /misc/
Disallow: /modules/
Disallow: /profiles/
Disallow: /scripts/
Disallow: /sites/
Disallow: /themes/
# Files
Disallow: /CHANGELOG.txt
Disallow: /cron.php
Disallow: /INSTALL.mysql.txt
Disallow: /INSTALL.pgsql.txt
Disallow: /install.php
Disallow: /INSTALL.txt
Disallow: /LICENSE.txt
Disallow: /MAINTAINERS.txt
Disallow: /update.php
Disallow: /UPGRADE.txt
Disallow: /xmlrpc.php
# Paths (clean URLs)
Disallow: /admin/
Disallow: /comment/reply/
Disallow: /contact/
Disallow: /logout/
Disallow: /node/add/
Disallow: /search/
Disallow: /user/register/
Disallow: /user/password/
Disallow: /user/login/
# Paths (no clean URLs)
Disallow: /?q=admin/
Disallow: /?q=comment/reply/
Disallow: /?q=contact/
Disallow: /?q=logout/
Disallow: /?q=node/add/
Disallow: /?q=search/
Disallow: /?q=user/password/
Disallow: /?q=user/register/
Disallow: /?q=user/login/

User-agent: baiduspider
# Directories
Disallow: /includes/
Disallow: /misc/
Disallow: /modules/
Disallow: /profiles/
Disallow: /scripts/
Disallow: /sites/
Disallow: /themes/
# Files
Disallow: /CHANGELOG.txt
Disallow: /cron.php
Disallow: /INSTALL.mysql.txt
Disallow: /INSTALL.pgsql.txt
Disallow: /install.php
Disallow: /INSTALL.txt
Disallow: /LICENSE.txt
Disallow: /MAINTAINERS.txt
Disallow: /update.php
Disallow: /UPGRADE.txt
Disallow: /xmlrpc.php
# Paths (clean URLs)
Disallow: /admin/
Disallow: /comment/reply/
Disallow: /contact/
Disallow: /logout/
Disallow: /node/add/
Disallow: /search/
Disallow: /user/register/
Disallow: /user/password/
Disallow: /user/login/
# Paths (no clean URLs)
Disallow: /?q=admin/
Disallow: /?q=comment/reply/
Disallow: /?q=contact/
Disallow: /?q=logout/
Disallow: /?q=node/add/
Disallow: /?q=search/
Disallow: /?q=user/password/
Disallow: /?q=user/register/
Disallow: /?q=user/login/
User-agent: *
Disallow: /

這里主要通過(guò)Disallow,限制訪問(wèn)一些無(wú)關(guān)管理頁(yè)面與文件,另外通過(guò)User-agent * 屏蔽了除了百度與谷歌的所有搜索引擎爬蟲(chóng)。關(guān)于robots.txt具體使用,請(qǐng)搜索robots.txt教程

?

另外關(guān)于搜索引擎的爬蟲(chóng)知識(shí),在網(wǎng)上看到一篇很好的介紹文章,轉(zhuǎn)載在這里:http://robbin.javaeye.com/blog/451014

因?yàn)樗阉饕娴牧餍?#xff0c;網(wǎng)絡(luò)爬蟲(chóng)已經(jīng)成了很普及網(wǎng)絡(luò)技術(shù),除了專(zhuān)門(mén)做搜索的Google,Yahoo,微軟,百度以外,幾乎每個(gè)大型門(mén)戶(hù)網(wǎng)站都有自己的搜索 引擎,大大小小叫得出來(lái)名字得就幾十種,還有各種不知名的幾千幾萬(wàn)種,對(duì)于一個(gè)內(nèi)容型驅(qū)動(dòng)的網(wǎng)站來(lái)說(shuō),受到網(wǎng)絡(luò)爬蟲(chóng)的光顧是不可避免的。?

一些智能的搜索引擎爬蟲(chóng)的爬取頻率比較合理,對(duì)網(wǎng)站資源消耗比較少,但是很多糟糕的網(wǎng)絡(luò)爬蟲(chóng),對(duì)網(wǎng)頁(yè)爬取能力很差,經(jīng)常并發(fā)幾十上百個(gè)請(qǐng)求循環(huán)重 復(fù)抓取,這種爬蟲(chóng)對(duì)中小型網(wǎng)站往往是毀滅性打擊,特別是一些缺乏爬蟲(chóng)編寫(xiě)經(jīng)驗(yàn)的程序員寫(xiě)出來(lái)的爬蟲(chóng)破壞力極強(qiáng)。曾經(jīng)有一次我在JavaEye的日志里面發(fā)現(xiàn)一個(gè)User- Agent是Java的爬蟲(chóng)一天之內(nèi)爬取了將近100萬(wàn)次動(dòng)態(tài)請(qǐng)求。這是一個(gè)用JDK標(biāo)準(zhǔn)類(lèi)庫(kù)編寫(xiě)的簡(jiǎn)單爬取網(wǎng)頁(yè)程序,由于JavaEye網(wǎng)站內(nèi)部鏈接構(gòu) 成了回環(huán)導(dǎo)致程序陷入了死循環(huán)。對(duì)于JavaEye這種百萬(wàn)PV級(jí)別的網(wǎng)站來(lái)說(shuō),這種爬蟲(chóng)造成的訪問(wèn)壓力會(huì)非常大,會(huì)導(dǎo)致網(wǎng)站訪問(wèn)速度緩慢,甚至無(wú)法訪 問(wèn)。?

此外,相當(dāng)數(shù)量的的網(wǎng)頁(yè)爬蟲(chóng)目的是盜取目標(biāo)網(wǎng)站的內(nèi)容。比方說(shuō)JavaEye網(wǎng)站就曾經(jīng)被兩個(gè)競(jìng)爭(zhēng)對(duì)手網(wǎng)站爬取論壇帖子,然后在自己的論壇里面用 機(jī)器人發(fā)帖,因此這種爬蟲(chóng)不僅僅影響網(wǎng)站訪問(wèn)速度,而且侵犯了網(wǎng)站的版權(quán)。?

對(duì)于一個(gè)原創(chuàng)內(nèi)容豐富,URL結(jié)構(gòu)合理易于爬取的網(wǎng)站來(lái)說(shuō),簡(jiǎn)直就是各種爬蟲(chóng)的盤(pán)中大餐,很多網(wǎng)站的訪問(wèn)流量構(gòu)成當(dāng)中,爬蟲(chóng)帶來(lái)的流量要遠(yuǎn)遠(yuǎn)超過(guò) 真實(shí)用戶(hù)訪問(wèn)流量,甚至爬蟲(chóng)流量要高出真實(shí)流量一個(gè)數(shù)量級(jí)。像JavaEye網(wǎng)站雖然設(shè)置了相當(dāng)嚴(yán)格的反爬蟲(chóng)策略,但是網(wǎng)站處理的動(dòng)態(tài)請(qǐng)求數(shù)量仍然是真實(shí) 用戶(hù)訪問(wèn)流量的2倍。可以肯定的說(shuō),當(dāng)今互聯(lián)網(wǎng)的網(wǎng)絡(luò)流量至少有2/3的流量爬蟲(chóng)帶來(lái)的。因此反爬蟲(chóng)是一個(gè)值得網(wǎng)站長(zhǎng)期探索和解決的問(wèn)題。?

一、手工識(shí)別和拒絕爬蟲(chóng)的訪問(wèn)?

有相當(dāng)多的爬蟲(chóng)對(duì)網(wǎng)站會(huì)造成非常高的負(fù)載,因此識(shí)別爬蟲(chóng)的來(lái)源IP是很容易的事情。最簡(jiǎn)單的辦法就是用netstat檢查80端口的連接:

C代碼?

  1. netstat?-nt?|?grep?youhostip:80?|?awk?'{print?$5}'?|?awk?-F":"?'{print?$1}'|?sort?|?uniq?-c?|?sort?-r?-n???

這行shell可以按照80端口連接數(shù)量對(duì)來(lái)源IP進(jìn)行排序,這樣可以直觀的判斷出來(lái)網(wǎng)頁(yè)爬蟲(chóng)。一般來(lái)說(shuō)爬蟲(chóng)的并發(fā)連接非常高。?

如果使用lighttpd做Web Server,那么就更簡(jiǎn)單了。lighttpd的mod_status提供了非常直觀的并發(fā)連接的信息,包括每個(gè)連接的來(lái)源IP,訪問(wèn)的URL,連接狀 態(tài)和連接時(shí)間等信息,只要檢查那些處于handle-request狀態(tài)的高并發(fā)IP就可以很快確定爬蟲(chóng)的來(lái)源IP了。?

拒絕爬蟲(chóng)請(qǐng)求既可以通過(guò)內(nèi)核防火墻來(lái)拒絕,也可以在web server拒絕,比方說(shuō)用iptables拒絕:?
C代碼?

  1. iptables?-A?INPUT?-i?eth0?-j?DROP?-p?tcp?--dport?80?-s?84.80.46.0/24????

直接封鎖爬蟲(chóng)所在的C網(wǎng)段地址。這是因?yàn)橐话闩老x(chóng)都是運(yùn)行在托管機(jī)房里面,可能在一個(gè)C段里面的多臺(tái)服務(wù)器上面都有爬蟲(chóng),而這個(gè)C段不可能是用戶(hù) 寬帶上網(wǎng),封鎖C段可以很大程度上解決問(wèn)題。?

有些人提出一種腦殘的觀點(diǎn),說(shuō)我要懲罰這些爬蟲(chóng)。我專(zhuān)門(mén)在網(wǎng)頁(yè)里面設(shè)計(jì)動(dòng)態(tài)循環(huán)鏈接頁(yè)面,讓爬蟲(chóng)掉進(jìn)陷阱,死循環(huán)爬不出來(lái),其實(shí)根本用不著設(shè)置陷 阱,弱智爬蟲(chóng)對(duì)正常網(wǎng)頁(yè)自己就爬不出來(lái),這樣做多此一舉不說(shuō),而且會(huì)讓真正的搜索引擎降低你的網(wǎng)頁(yè)排名。而且運(yùn)行一個(gè)爬蟲(chóng)根本不消耗什么機(jī)器資源,相反, 真正寶貴的是你的服務(wù)器CPU資源和服務(wù)器帶寬,簡(jiǎn)單的拒絕掉爬蟲(chóng)的請(qǐng)求是反爬蟲(chóng)最有效的策略。?

二、通過(guò)識(shí)別爬蟲(chóng)的User-Agent信息來(lái)拒絕爬蟲(chóng)?

有很多爬蟲(chóng)并不會(huì)以很高的并發(fā)連接爬取,一般不容易暴露自己;有些爬蟲(chóng)的來(lái)源IP分布很廣,很難簡(jiǎn)單的通過(guò)封鎖IP段地址來(lái)解決問(wèn)題;另外還有很 多各種各樣的小爬蟲(chóng),它們?cè)趪L試Google以外創(chuàng)新的搜索方式,每個(gè)爬蟲(chóng)每天爬取幾萬(wàn)的網(wǎng)頁(yè),幾十個(gè)爬蟲(chóng)加起來(lái)每天就能消耗掉上百萬(wàn)動(dòng)態(tài)請(qǐng)求的資源,由 于每個(gè)小爬蟲(chóng)單獨(dú)的爬取量都很低,所以你很難把它從每天海量的訪問(wèn)IP地址當(dāng)中把它準(zhǔn)確的挖出來(lái)。?

這種情況下我們可以通過(guò)爬蟲(chóng)的User-Agent信息來(lái)識(shí)別。每個(gè)爬蟲(chóng)在爬取網(wǎng)頁(yè)的時(shí)候,會(huì)聲明自己的User-Agent信息,因此我們就可 以通過(guò)記錄和分析User-Agent信息來(lái)挖掘和封鎖爬蟲(chóng)。我們需要記錄每個(gè)請(qǐng)求的User-Agent信息,對(duì)于Rails來(lái)說(shuō)我們可以簡(jiǎn)單的在 app/controllers/application.rb里面添加一個(gè)全局的before_filter,來(lái)記錄每個(gè)請(qǐng)求的User-Agent信 息:?
Ruby 代碼?

  1. logger.info?"HTTP_USER_AGENT?#{request.env["HTTP_USER_AGENT"]}"????

然后統(tǒng)計(jì)每天的production.log,抽取User-Agent信息,找出訪問(wèn)量最大的那些User-Agent。要注意的是我們只關(guān)注 那些爬蟲(chóng)的User-Agent信息,而不是真正瀏覽器User-Agent,所以還要排除掉瀏覽器User-Agent,要做到這一點(diǎn)僅僅需要一行 shell:?
Ruby 代碼?

  1. grep?HTTP_USER_AGENT?production.log?|?grep?-v?-E?'MSIE|Firefox|Chrome|Opera|Safari|Gecko'?|?sort?|?uniq?-c?|?sort?-r?-n?|?head?-n?100?>?bot.log????

統(tǒng)計(jì)結(jié)果類(lèi)似這樣:?
C代碼?

  1. 57335?HTTP_USER_AGENT?Baiduspider+(+http://www.baidu.com/search/spider.htm)??
  2. 56639?HTTP_USER_AGENT?Mozilla/5.0?(compatible;?Googlebot/2.1;?+http://www.google.com/bot.html)??
  3. 42610?HTTP_USER_AGENT?Mediapartners-Google??
  4. 19131?HTTP_USER_AGENT?msnbot/2.0b?(+http://search.msn.com/msnbot.htm)??

從日志就可以直觀的看出每個(gè)爬蟲(chóng)的請(qǐng)求次數(shù)。要根據(jù)User-Agent信息來(lái)封鎖爬蟲(chóng)是件很容易的事情,lighttpd配置如下:?
C代碼?

  1. $HTTP["useragent"]?=~?"qihoobot|^Java|Commons-HttpClient|Wget|^PHP|Ruby|Python"?{??
  2. ??url.rewrite?=?(?"^/(.*)"?=>?"/crawler.html"?)??
  3. }??

使用這種方式來(lái)封鎖爬蟲(chóng)雖然簡(jiǎn)單但是非常有效,除了封鎖特定的爬蟲(chóng),還可以封鎖常用的編程語(yǔ)言和HTTP類(lèi)庫(kù)的User-Agent信息,這樣就 可以避免很多無(wú)謂的程序員用來(lái)練手的爬蟲(chóng)程序?qū)W(wǎng)站的騷擾。?

還有一種比較常見(jiàn)的情況,就是某個(gè)搜索引擎的爬蟲(chóng)對(duì)網(wǎng)站爬取頻率過(guò)高,但是搜索引擎給網(wǎng)站帶來(lái)了很多流量,我們并不希望簡(jiǎn)單的封鎖爬蟲(chóng),僅僅是希望降低爬蟲(chóng)的請(qǐng)求頻率,減輕爬蟲(chóng)對(duì)網(wǎng)站造成的負(fù)載,那么我們可以這樣做:?
C代碼?

  1. $HTTP["user-agent"]?=~?"Baiduspider+"?{??
  2. ????connection.delay-seconds?=?10??
  3. }??

對(duì)百度的爬蟲(chóng)請(qǐng)求延遲10秒鐘再進(jìn)行處理,這樣就可以有效降低爬蟲(chóng)對(duì)網(wǎng)站的負(fù)載了。?

三、通過(guò)網(wǎng)站流量統(tǒng)計(jì)系統(tǒng)和日志分析來(lái)識(shí)別爬蟲(chóng)?

有些爬蟲(chóng)喜歡修改User-Agent信息來(lái)偽裝自己,把自己偽裝成一個(gè)真實(shí)瀏覽器的User-Agent信息,讓你無(wú)法有效的識(shí)別。這種情況下 我們可以通過(guò)網(wǎng)站流量系統(tǒng)記錄的真實(shí)用戶(hù)訪問(wèn)IP來(lái)進(jìn)行識(shí)別。?

主流的網(wǎng)站流量統(tǒng)計(jì)系統(tǒng)不外乎兩種實(shí)現(xiàn)策略:一種策略是在網(wǎng)頁(yè)里面嵌入一段js,這段js會(huì)向特定的統(tǒng)計(jì)服務(wù)器發(fā)送請(qǐng)求的方式記錄訪問(wèn)量;另一種 策略是直接分析服務(wù)器日志,來(lái)統(tǒng)計(jì)網(wǎng)站訪問(wèn)量。在理想的情況下,嵌入js的方式統(tǒng)計(jì)的網(wǎng)站流量應(yīng)該高于分析服務(wù)器日志,這是因?yàn)橛脩?hù)瀏覽器會(huì)有緩存,不一 定每次真實(shí)用戶(hù)訪問(wèn)都會(huì)觸發(fā)服務(wù)器的處理。但實(shí)際情況是,分析服務(wù)器日志得到的網(wǎng)站訪問(wèn)量遠(yuǎn)遠(yuǎn)高于嵌入js方式,極端情況下,甚至要高出10倍以上。?

現(xiàn)在很多網(wǎng)站喜歡采用awstats來(lái)分析服務(wù)器日志,來(lái)計(jì)算網(wǎng)站的訪問(wèn)量,但是當(dāng)他們一旦采用Google Analytics來(lái)統(tǒng)計(jì)網(wǎng)站流量的時(shí)候,卻發(fā)現(xiàn)GA統(tǒng)計(jì)的流量遠(yuǎn)遠(yuǎn)低于awstats,為什么GA和awstats統(tǒng)計(jì)會(huì)有這么大差異呢?罪魁禍?zhǔn)拙褪?把自己偽裝成瀏覽器的網(wǎng)絡(luò)爬蟲(chóng)。這種情況下awstats無(wú)法有效的識(shí)別了,所以awstats的統(tǒng)計(jì)數(shù)據(jù)會(huì)虛高。?

其實(shí)作為一個(gè)網(wǎng)站來(lái)說(shuō),如果希望了解自己的網(wǎng)站真實(shí)訪問(wèn)量,希望精確了解網(wǎng)站每個(gè)頻道的訪問(wèn)量和訪問(wèn)用戶(hù),應(yīng)該用頁(yè)面里面嵌入js的方式來(lái)開(kāi)發(fā)自 己的網(wǎng)站流量統(tǒng)計(jì)系統(tǒng)。自己做一個(gè)網(wǎng)站流量統(tǒng)計(jì)系統(tǒng)是件很簡(jiǎn)單的事情,寫(xiě)段服務(wù)器程序響應(yīng)客戶(hù)段js的請(qǐng)求,分析和識(shí)別請(qǐng)求然后寫(xiě)日志的同時(shí)做后臺(tái)的異步 統(tǒng)計(jì)就搞定了。?

通過(guò)流量統(tǒng)計(jì)系統(tǒng)得到的用戶(hù)IP基本是真實(shí)的用戶(hù)訪問(wèn),因?yàn)橐话闱闆r下爬蟲(chóng)是無(wú)法執(zhí)行網(wǎng)頁(yè)里面的js代碼片段的。所以我們可以拿流量統(tǒng)計(jì)系統(tǒng)記錄 的IP和服務(wù)器程序日志記錄的IP地址進(jìn)行比較,如果服務(wù)器日志里面某個(gè)IP發(fā)起了大量的請(qǐng)求,在流量統(tǒng)計(jì)系統(tǒng)里面卻根本找不到,或者即使找得到,可訪問(wèn) 量卻只有寥寥幾個(gè),那么無(wú)疑就是一個(gè)網(wǎng)絡(luò)爬蟲(chóng)。?

分析服務(wù)器日志統(tǒng)計(jì)訪問(wèn)最多的IP地址段一行shell就可以了:?
C代碼?

  1. grep?Processing?production.log?|?awk?'{print?$4}'?|?awk?-F'.'?'{print?$1"."$2"."$3".0"}'?|?sort?|?uniq?-c?|?sort?-r?-n?|?head?-n?200?>?stat_ip.log????

然后把統(tǒng)計(jì)結(jié)果和流量統(tǒng)計(jì)系統(tǒng)記錄的IP地址進(jìn)行對(duì)比,排除真實(shí)用戶(hù)訪問(wèn)IP,再排除我們希望放行的網(wǎng)頁(yè)爬蟲(chóng),比方Google,百度,微軟 msn爬蟲(chóng)等等。最后的分析結(jié)果就就得到了爬蟲(chóng)的IP地址了。以下代碼段是個(gè)簡(jiǎn)單的實(shí)現(xiàn)示意:?
Ruby 代碼?

  1. whitelist?=?[]??
  2. IO.foreach("#{RAILS_ROOT}/lib/whitelist.txt")?{?|line|?whitelist?<<?line.split[0].strip?if?line?}??
  3. ??
  4. realiplist?=?[]??
  5. IO.foreach("#{RAILS_ROOT}/log/visit_ip.log")?{?|line|??realiplist?<<?line.strip?if?line?}??
  6. ??
  7. iplist?=?[]??
  8. IO.foreach("#{RAILS_ROOT}/log/stat_ip.log")?do?|line|??
  9. ??ip?=?line.split[1].strip??
  10. ??iplist?<<?ip?if?line.split[0].to_i?>?3000?&&?!whitelist.include?(ip)?&&?!realiplist.include?(ip)??
  11. end???
  12. ??
  13. Report.deliver_crawler(iplist)??

分析服務(wù)器日志里面請(qǐng)求次數(shù)超過(guò)3000次的IP地址段,排除白名單地址和真實(shí)訪問(wèn)IP地址,最后得到的就是爬蟲(chóng)IP了,然后可以發(fā)送郵件通知管 理員進(jìn)行相應(yīng)的處理。?

四、網(wǎng)站的實(shí)時(shí)反爬蟲(chóng)防火墻實(shí)現(xiàn)策略?

通過(guò)分析日志的方式來(lái)識(shí)別網(wǎng)頁(yè)爬蟲(chóng)不是一個(gè)實(shí)時(shí)的反爬蟲(chóng)策略。如果一個(gè)爬蟲(chóng)非要針對(duì)你的網(wǎng)站進(jìn)行處心積慮的爬取,那么他可能會(huì)采用分布式爬取策 略,比方說(shuō)尋找?guī)装偕锨€(gè)國(guó)外的代理服務(wù)器瘋狂的爬取你的網(wǎng)站,從而導(dǎo)致網(wǎng)站無(wú)法訪問(wèn),那么你再分析日志是不可能及時(shí)解決問(wèn)題的。所以必須采取實(shí)時(shí)反爬蟲(chóng) 策略,要能夠動(dòng)態(tài)的實(shí)時(shí)識(shí)別和封鎖爬蟲(chóng)的訪問(wèn)。?

要自己編寫(xiě)一個(gè)這樣的實(shí)時(shí)反爬蟲(chóng)系統(tǒng)其實(shí)也很簡(jiǎn)單。比方說(shuō)我們可以用memcached來(lái)做訪問(wèn)計(jì)數(shù)器,記錄每個(gè)IP的訪問(wèn)頻度,在單位時(shí)間之 內(nèi),如果訪問(wèn)頻率超過(guò)一個(gè)閥值,我們就認(rèn)為這個(gè)IP很可能有問(wèn)題,那么我們就可以返回一個(gè)驗(yàn)證碼頁(yè)面,要求用戶(hù)填寫(xiě)驗(yàn)證碼。如果是爬蟲(chóng)的話(huà),當(dāng)然不可能填 寫(xiě)驗(yàn)證碼,所以就被拒掉了,這樣很簡(jiǎn)單就解決了爬蟲(chóng)問(wèn)題。?

用memcache記錄每個(gè)IP訪問(wèn)計(jì)數(shù),單位時(shí)間內(nèi)超過(guò)閥值就讓用戶(hù)填寫(xiě)驗(yàn)證碼,用Rails編寫(xiě)的示例代碼如下:?
Ruby 代碼?

  1. ip_counter?=?Rails.cache.increment(request.remote_ip)??
  2. if?!ip_counter??
  3. ??Rails.cache.write(request.remote_ip,?1,?:expires_in?=>?30.minutes)??
  4. elsif?ip_counter?>?2000??
  5. ??render?:template?=>?'test',?:status?=>?401?and?return?false??
  6. end??

這段程序只是最簡(jiǎn)單的示例,實(shí)際的代碼實(shí)現(xiàn)我們還會(huì)添加很多判斷,比方說(shuō)我們可能要排除白名單IP地址段,要允許特定的User-Agent通 過(guò),要針對(duì)登錄用戶(hù)和非登錄用戶(hù),針對(duì)有無(wú)referer地址采取不同的閥值和計(jì)數(shù)加速器等等。?

此外如果分布式爬蟲(chóng)爬取頻率過(guò)高的話(huà),過(guò)期就允許爬蟲(chóng)再次訪問(wèn)還是會(huì)對(duì)服務(wù)器造成很大的壓力,因此我們可以添加一條策略:針對(duì)要求用戶(hù)填寫(xiě)驗(yàn)證碼 的IP地址,如果該IP地址短時(shí)間內(nèi)繼續(xù)不停的請(qǐng)求,則判斷為爬蟲(chóng),加入黑名單,后續(xù)請(qǐng)求全部拒絕掉。為此,示例代碼可以改進(jìn)一下:?
Ruby 代碼?

  1. before_filter?:ip_firewall,?:except?=>?:test??
  2. def?ip_firewall??
  3. ??render?:file?=>?"#{RAILS_ROOT}/public/403.html",?:status?=>?403?if?BlackList.include?(ip_sec)??
  4. end??

我們可以定義一個(gè)全局的過(guò)濾器,對(duì)所有請(qǐng)求進(jìn)行過(guò)濾,出現(xiàn)在黑名單的IP地址一律拒絕。對(duì)非黑名單的IP地址再進(jìn)行計(jì)數(shù)和統(tǒng)計(jì):?
Ruby 代碼?

  1. ip_counter?=?Rails.cache.increment(request.remote_ip)??
  2. if?!ip_counter??
  3. ??Rails.cache.write(request.remote_ip,?1,?:expires_in?=>?30.minutes)??
  4. elsif?ip_counter?>?2000??
  5. ??crawler_counter?=?Rails.cache.increment("crawler/#{request.remote_ip}")??
  6. ??if?!crawler_counter??
  7. ????Rails.cache.write("crawler/#{request.remote_ip}",?1,?:expires_in?=>?10.minutes)??
  8. ??elsif?crawler_counter?>?50??
  9. ????BlackList.add(ip_sec)??
  10. ????render?:file?=>?"#{RAILS_ROOT}/public/403.html",?:status?=>?403?and?return?false??
  11. ??end??
  12. ??render?:template?=>?'test',?:status?=>?401?and?return?false??
  13. end??

如果某個(gè)IP地址單位時(shí)間內(nèi)訪問(wèn)頻率超過(guò)閥值,再增加一個(gè)計(jì)數(shù)器,跟蹤他會(huì)不會(huì)立刻填寫(xiě)驗(yàn)證碼,如果他不填寫(xiě)驗(yàn)證碼,在短時(shí)間內(nèi)還是高頻率訪問(wèn), 就把這個(gè)IP地址段加入黑名單,除非用戶(hù)填寫(xiě)驗(yàn)證碼激活,否則所有請(qǐng)求全部拒絕。這樣我們就可以通過(guò)在程序里面維護(hù)黑名單的方式來(lái)動(dòng)態(tài)的跟蹤爬蟲(chóng)的情況, 甚至我們可以自己寫(xiě)個(gè)后臺(tái)來(lái)手工管理黑名單列表,了解網(wǎng)站爬蟲(chóng)的情況。?

這個(gè)策略已經(jīng)比較智能了,但是還不夠好!我們還可以繼續(xù)改進(jìn):?

1、用網(wǎng)站流量統(tǒng)計(jì)系統(tǒng)來(lái)改進(jìn)實(shí)時(shí)反爬蟲(chóng)系統(tǒng)?

還記得嗎?網(wǎng)站流量統(tǒng)計(jì)系統(tǒng)記錄的IP地址是真實(shí)用戶(hù)訪問(wèn)IP,所以我們?cè)诰W(wǎng)站流量統(tǒng)計(jì)系統(tǒng)里面也去操作memcached,但是這次不是增加計(jì) 數(shù)值,而是減少計(jì)數(shù)值。在網(wǎng)站流量統(tǒng)計(jì)系統(tǒng)里面每接收到一個(gè)IP請(qǐng)求,就相應(yīng)的cache.decrement(key)。所以對(duì)于真實(shí)用戶(hù)的IP來(lái)說(shuō), 它的計(jì)數(shù)值總是加1然后就減1,不可能很高。這樣我們就可以大大降低判斷爬蟲(chóng)的閥值,可以更加快速準(zhǔn)確的識(shí)別和拒絕掉爬蟲(chóng)。?

2、用時(shí)間窗口來(lái)改進(jìn)實(shí)時(shí)反爬蟲(chóng)系統(tǒng)?

爬蟲(chóng)爬取網(wǎng)頁(yè)的頻率都是比較固定的,不像人去訪問(wèn)網(wǎng)頁(yè),中間的間隔時(shí)間比較無(wú)規(guī)則,所以我們可以給每個(gè)IP地址建立一個(gè)時(shí)間窗口,記錄IP地址最 近12次訪問(wèn)時(shí)間,每記錄一次就滑動(dòng)一次窗口,比較最近訪問(wèn)時(shí)間和當(dāng)前時(shí)間,如果間隔時(shí)間很長(zhǎng)判斷不是爬蟲(chóng),清除時(shí)間窗口,如果間隔不長(zhǎng),就回溯計(jì)算指定 時(shí)間段的訪問(wèn)頻率,如果訪問(wèn)頻率超過(guò)閥值,就轉(zhuǎn)向驗(yàn)證碼頁(yè)面讓用戶(hù)填寫(xiě)驗(yàn)證碼。?

最終這個(gè)實(shí)時(shí)反爬蟲(chóng)系統(tǒng)就相當(dāng)完善了,它可以很快的識(shí)別并且自動(dòng)封鎖爬蟲(chóng)的訪問(wèn),保護(hù)網(wǎng)站的正常訪問(wèn)。不過(guò)有些爬蟲(chóng)可能相當(dāng)狡猾,它也許會(huì)通過(guò)大 量的爬蟲(chóng)測(cè)試來(lái)試探出來(lái)你的訪問(wèn)閥值,以低于閥值的爬取速度抓取你的網(wǎng)頁(yè),因此我們還需要輔助第3種辦法,用日志來(lái)做后期的分析和識(shí)別,就算爬蟲(chóng)爬的再 慢,它累計(jì)一天的爬取量也會(huì)超過(guò)你的閥值被你日志分析程序識(shí)別出來(lái)。?

總之我們綜合運(yùn)用上面的四種反爬蟲(chóng)策略,可以很大程度上緩解爬蟲(chóng)對(duì)網(wǎng)站造成的負(fù)面影響,保證網(wǎng)站的正常訪問(wèn)。

一、搜索引擎的蜘蛛,是不是爬得越多越好?

? ? ?當(dāng)然不是!不論什么搜索引擎的爬蟲(chóng),來(lái)抓取你網(wǎng)站的頁(yè)面的時(shí)候,肯定在消耗你的網(wǎng)站資源,例如網(wǎng)站的連接數(shù)、網(wǎng)絡(luò)帶寬資源(空間流量)、服務(wù)器的負(fù)載。
另外,搜索引擎的爬蟲(chóng)來(lái)抓取你的頁(yè)面數(shù)據(jù)后,它也不一定收用數(shù)據(jù)。只代表它“到此一游”留下痕跡而已。因此你的網(wǎng)站為它“服務(wù)過(guò)、接待過(guò)”。

? ? ?對(duì)于一個(gè)原創(chuàng)內(nèi)容豐富,URL結(jié)構(gòu)合理易于爬取的網(wǎng)站來(lái)說(shuō),簡(jiǎn)直就是各種爬蟲(chóng)的盤(pán)中大餐,很多網(wǎng)站的訪問(wèn)流量構(gòu)成當(dāng)中,爬蟲(chóng)帶來(lái)的流量要遠(yuǎn)遠(yuǎn)超過(guò)真實(shí)用戶(hù)訪問(wèn)流量,甚至爬蟲(chóng)流量要高出真實(shí)流量一個(gè)數(shù)量級(jí)。像提高網(wǎng)站有效利用率雖然設(shè)置了相當(dāng)嚴(yán)格的反爬蟲(chóng)策略,但是網(wǎng)站處理的動(dòng)態(tài)請(qǐng)求數(shù)量仍然是真實(shí)用戶(hù)訪問(wèn)流量的2倍。可以肯定的說(shuō),當(dāng)今互聯(lián)網(wǎng)的網(wǎng)絡(luò)流量至少有2/3的流量爬蟲(chóng)帶來(lái)的。因此反爬蟲(chóng)是一個(gè)值得網(wǎng)站長(zhǎng)期探索和解決的問(wèn)題。

搜索引擎的主要工作流程(圖)

搜索引擎爬蟲(chóng)對(duì)網(wǎng)站的負(fù)面影響。

1.網(wǎng)站有限的帶寬資源,而爬蟲(chóng)的量過(guò)多,導(dǎo)致正常用戶(hù)訪問(wèn)緩慢。
例如,原本虛擬主機(jī)主機(jī)的連接數(shù)受限,帶寬資源也是有限。這種情況搜索引擎爬蟲(chóng)受影響呈現(xiàn)更明顯。

2.搜索引擎爬蟲(chóng)過(guò)頻密,抓取掃描很多無(wú)效頁(yè)面。甚至抓頁(yè)面抓到服務(wù)器報(bào)502、500 、504 等服務(wù)器內(nèi)部錯(cuò)誤了,蜘蛛爬蟲(chóng)還在不停使勁抓取。
不論是實(shí)際生產(chǎn)監(jiān)控,還是網(wǎng)友反映,部分搜索引擎爬蟲(chóng)可用幾個(gè)詞來(lái)形容“壞蜘蛛”“惡爬蟲(chóng)”。很多討論搜索引擎相關(guān)的文章,已經(jīng)將它們列過(guò)排行榜。有興趣的可更多了解它。

百度蜘蛛工作圖

3.與網(wǎng)站主題不相關(guān)的搜索引擎爬蟲(chóng)消耗資源。
例如,典型的例子搜索引擎“一淘網(wǎng)蜘蛛(EtaoSpider)為一淘網(wǎng)抓取工具。”被各大電子商務(wù)購(gòu)物網(wǎng)站屏蔽。拒絕一淘網(wǎng)抓取其商品信息及用戶(hù)產(chǎn)生的點(diǎn)評(píng)內(nèi)容。被禁止的原因首先應(yīng)該是它們之間沒(méi)有合作互利的關(guān)系,還有就是EtaoSpider爬蟲(chóng)是一個(gè)抓取最瘋狂的蜘蛛。統(tǒng)計(jì)發(fā)現(xiàn)EtaoSpider爬蟲(chóng)的一天爬行量比“百度蜘蛛:Baiduspider”“360蜘蛛:360Spider”“SOSO蜘蛛:Sosospider”等主流蜘蛛爬蟲(chóng)多幾倍,并且是遠(yuǎn)遠(yuǎn)的多。重點(diǎn)是EtaoSpider被抓取只會(huì)消耗你的網(wǎng)站資源,它不會(huì)給你帶來(lái)訪問(wèn)量,或者其它對(duì)你有利用的。中文成語(yǔ)詞典可用一個(gè)詞來(lái)形容,這個(gè)詞留給大家想吧。

4.一些搜索引擎開(kāi)發(fā)程序員,它們寫(xiě)的爬蟲(chóng)程序在測(cè)試爬行。你懂的...

5.robots.txt文件不是萬(wàn)能!
肯定有很多人認(rèn)為,在robots.txt設(shè)置屏蔽搜索引擎爬蟲(chóng)即可,或者允許某些特定的搜索引擎爬蟲(chóng),能達(dá)到你預(yù)想效果。
不錯(cuò)正規(guī)的搜索引擎會(huì)遵守規(guī)則,且不會(huì)及時(shí)生效。實(shí)際中某些蜘蛛往往不是這樣的,先掃描抓取你的頁(yè)面,無(wú)視你的robots.txt。也可能它抓取后不一定留用;或者它只是統(tǒng)計(jì)信息,收集互聯(lián)網(wǎng)行業(yè)趨勢(shì)分析統(tǒng)計(jì)。

6.還有一種它們不是蜘蛛,但其有蜘蛛的特性。例如采集軟件,采集程序,網(wǎng)絡(luò)掃描e-mail地址的工具,各式各樣的SEO分析統(tǒng)計(jì)工具,千奇百怪的網(wǎng)站漏洞掃描工具,等等,只有你想不到的工具,沒(méi)有它做不到的...

二、有效指引搜索引擎對(duì)應(yīng)的措施,及解決方法:

1.依據(jù)空間流量實(shí)際情況,就保留幾個(gè)常用的屏蔽掉其它蜘蛛以節(jié)省流量。以暫時(shí)空間流量還足夠使用,先保證正常瀏覽器優(yōu)先。

2.從服務(wù)器防火墻iptable直接屏蔽蜘蛛IP段、詳細(xì)的IP。這是最直接、有效的屏蔽方法。

3.WWW服務(wù)器層面做限制。例如Nginx,Squid,Lighttpd,直接通過(guò)“http_user_agent”屏蔽搜索引擎爬蟲(chóng)。

4.最后robots.txt文件做限制。搜索引擎國(guó)際規(guī)則還是要遵循規(guī)則的,讓robots.txt明示公布于眾。

后續(xù)文章會(huì)詳細(xì)介紹該方法,包括如果發(fā)現(xiàn)蜘蛛,從網(wǎng)站的日志里統(tǒng)計(jì)蜘蛛,發(fā)現(xiàn)未知的蜘蛛。針對(duì)不同的蜘蛛,屏蔽蜘蛛、禁止爬蟲(chóng)怎么樣更高效,更快捷。并且通過(guò)實(shí)例來(lái)介紹。

象形圖示蜘蛛,爬蟲(chóng)機(jī)器人(圖)

三、收集最新最準(zhǔn)確各大搜索引擎蜘蛛名稱(chēng)

信息來(lái)源線上:最新最準(zhǔn)確

根據(jù)線上空間的訪問(wèn)日志來(lái)整理常見(jiàn)的蜘蛛名稱(chēng),不求最全,但力求爬蟲(chóng)信息資料最新最準(zhǔn)確。以下搜索引擎蜘蛛名稱(chēng)都是根據(jù)線上空間日志親手提取。
各種搜索引擎的蜘蛛爬蟲(chóng)會(huì)不斷地訪問(wèn)抓取我們站點(diǎn)的內(nèi)容,也會(huì)消耗站點(diǎn)的一定流量,有時(shí)候就需要屏蔽某些蜘蛛訪問(wèn)我們的站點(diǎn)。
其實(shí)有效常用的搜索引擎就那么幾個(gè),只要在robots.txt文件里把常用的幾個(gè)搜索引擎蜘蛛允許放行就好了,其它的爬蟲(chóng)統(tǒng)統(tǒng)通過(guò)通配符(*)禁止掉,屏蔽某些蜘蛛。

現(xiàn)況:

從網(wǎng)上獲取的搜索引擎蜘蛛名稱(chēng),幾乎都是原文復(fù)制粘貼的轉(zhuǎn)載又轉(zhuǎn)載的文章,而且很多的資料都是過(guò)期的了,這些舊資料根本就沒(méi)修正和更新(實(shí)際用處不大),并且關(guān)于蜘蛛名稱(chēng)、大小寫(xiě)眾說(shuō)不一,根本就獲取不到一個(gè)準(zhǔn)確無(wú)誤的資料信息。

最新最準(zhǔn)確各大搜索引擎蜘蛛名稱(chēng):
1、百度蜘蛛:Baiduspider
網(wǎng)上的資料百度蜘蛛名稱(chēng)有BaiduSpider、baiduspider等,都洗洗睡吧,那是舊黃歷了。百度蜘蛛最新名稱(chēng)為Baiduspider。日志中還發(fā)現(xiàn)了Baiduspider-image這個(gè)百度旗下蜘蛛,查了下資料(其實(shí)直接看名字就可以了……),是抓取圖片的蜘蛛。
常見(jiàn)百度旗下同類(lèi)型蜘蛛還有下面這些:Baiduspider-mobile(抓取wap)、Baiduspider-image(抓取圖片)、Baiduspider-video(抓取視頻)、Baiduspider-news(抓取新聞)。
注:以上百度蜘蛛目前常見(jiàn)的是Baiduspider和Baiduspider-image兩種。

2、谷歌蜘蛛:Googlebot
這個(gè)爭(zhēng)議較少,但也有說(shuō)是GoogleBot的。谷歌蜘蛛最新名稱(chēng)為“compatible; Googlebot/2.1;”。還發(fā)現(xiàn)了Googlebot-Mobile,看名字是抓取wap內(nèi)容的。

3、360蜘蛛:360Spider,它是一個(gè)很“勤奮抓爬”的蜘蛛。

4、SOSO蜘蛛:Sosospider,也可為它頒一個(gè)“勤奮抓爬”獎(jiǎng)的蜘蛛。

5、雅虎蜘蛛:“Yahoo! Slurp China”或者Yahoo!?
名稱(chēng)中帶“Slurp”和空格,名稱(chēng)有空格robots里名稱(chēng)可以使用“Slurp”或者“Yahoo”單詞描述,不知道有效無(wú)效。

6、有道蜘蛛:YoudaoBot,YodaoBot(兩個(gè)名字都有,中文拼音少了個(gè)U字母讀音差別很大嘎,這都會(huì)少?)

7、搜狗蜘蛛:Sogou News Spider
搜狗蜘蛛還包括如下這些:Sogou web spider、Sogou inst spider、Sogou spider2、Sogou blog、Sogou News Spider、Sogou Orion spider,
(參考一些網(wǎng)站的robots文件,搜狗蜘蛛名稱(chēng)可以用Sogou概括,無(wú)法驗(yàn)證不知道有沒(méi)有效)

看看最權(quán)威的百度的robots.txt ,http://www.baidu.com/robots.txt 就為Sogou搜狗蜘蛛費(fèi)了不少字節(jié),占了一大塊領(lǐng)地。
“Sogou web spider;Sogou inst spider;Sogou spider2;Sogou blog;Sogou News Spider;Sogou Orion spider”目前6個(gè),名稱(chēng)都帶空格。

線上常見(jiàn)"Sogou web spider/4.0" ;"Sogou News Spider/4.0" ;"Sogou inst spider/4.0" 可以為它頒個(gè)“占名為王”獎(jiǎng)。

8、MSN蜘蛛:msnbot,msnbot-media(只見(jiàn)到msnbot-media在狂爬……)

9、必應(yīng)蜘蛛:bingbot?
線上(compatible; bingbot/2.0;)

10、一搜蜘蛛:YisouSpider

11、Alexa蜘蛛:ia_archiver

12、宜搜蜘蛛:EasouSpider

13、即刻蜘蛛:JikeSpider

14、一淘網(wǎng)蜘蛛:EtaoSpider
"Mozilla/5.0 (compatible; EtaoSpider/1.0; http://省略/EtaoSpider)"

根據(jù)上述蜘蛛中選擇幾個(gè)常用的允許抓取,其余的都可以通過(guò)robots屏蔽抓取。如果你暫時(shí)空間流量還足夠使用,等流量緊張了就保留幾個(gè)常用的屏蔽掉其它蜘蛛以節(jié)省流量。至于那些蜘蛛抓取對(duì)網(wǎng)站能帶來(lái)有利用的價(jià)值,網(wǎng)站的管理者眼睛是雪亮的。

另外還發(fā)現(xiàn)了如 YandexBot、AhrefsBot和ezooms.bot這些蜘蛛,據(jù)說(shuō)這些蜘蛛國(guó)外噶,對(duì)中文網(wǎng)站用處很小。那不如就節(jié)省下資源。

小結(jié):
這次分析了對(duì)搜索引擎爬蟲(chóng)的危害,蜘蛛對(duì)網(wǎng)站的負(fù)面影響;如何有效指引搜索引擎對(duì)應(yīng)的措施,及解決方法;收集來(lái)源線上最新最準(zhǔn)確各大搜索引擎蜘蛛名稱(chēng)。

?

網(wǎng)站建設(shè)好了,當(dāng)然是希望網(wǎng)頁(yè)被搜索引擎收錄的越多越好,但有時(shí)候我們也會(huì)碰到網(wǎng)站不需要被搜索引擎收錄的情況。

比如,你要啟用一個(gè)新的域名做鏡像網(wǎng)站,主要用于PPC 的推廣,這個(gè)時(shí)候就要想辦法屏蔽搜索引擎蜘蛛抓取和索引我們鏡像網(wǎng)站的所有網(wǎng)頁(yè)。因?yàn)槿绻R像網(wǎng)站也被搜索引擎收錄的話(huà),很有可能會(huì)影響官網(wǎng)在搜索引擎的權(quán)重,這肯定是我們不想看到的結(jié)果。

以下列舉了屏蔽主流搜索引擎爬蟲(chóng)(蜘蛛)抓取/索引/收錄網(wǎng)頁(yè)的幾種思路。注意:是整站屏蔽,而且是盡可能的屏蔽掉所有主流搜索引擎的爬蟲(chóng)(蜘蛛)。

1、通過(guò) robots.txt 文件屏蔽

可以說(shuō) robots.txt 文件是最重要的一種渠道(能和搜索引擎建立直接對(duì)話(huà))。我通過(guò)分析我自己博客的服務(wù)器日志文件,給出以下建議(同時(shí)歡迎網(wǎng)友補(bǔ)充):

User-agent: Baiduspider

Disallow: /

User-agent: Googlebot

Disallow: /

User-agent: Googlebot-Mobile

Disallow: /

User-agent: Googlebot-Image

Disallow:/

User-agent: Mediapartners-Google

Disallow: /

User-agent: Adsbot-Google

Disallow: /

User-agent:Feedfetcher-Google

Disallow: /

User-agent: Yahoo! Slurp

Disallow: /

User-agent: Yahoo! Slurp China

Disallow: /

User-agent: Yahoo!-AdCrawler

Disallow: /

User-agent: YoudaoBot

Disallow: /

User-agent: Sosospider

Disallow: /

User-agent: Sogou spider

Disallow: /

User-agent: Sogou web spider

Disallow: /

User-agent: MSNBot

Disallow: /

User-agent: ia_archiver

Disallow: /

User-agent: Tomato Bot

Disallow: /

User-agent: *

Disallow: /

2、通過(guò) meta tag 屏蔽

在所有的網(wǎng)頁(yè)頭部文件添加,添加如下語(yǔ)句:

<meta name="robots" content="noindex, nofollow">

3、通過(guò)服務(wù)器(如:Linux/nginx )配置文件設(shè)置

直接過(guò)濾 spider/robots 的IP 段。

小注:第1招和第2招只對(duì)“君子”有效,防止“小人”要用到第3招(“君子”和“小人”分別泛指指遵守與不遵守 robots.txt 協(xié)議的 spider/robots),所以網(wǎng)站上線之后要不斷跟蹤分析日志,篩選出這些 badbot 的ip,然后屏蔽之。

這里有一個(gè)badbot ip 數(shù)據(jù)庫(kù):http://www.spam-whackers.com/bad.bots.htm

4、通過(guò)搜索引擎提供的站長(zhǎng)工具,刪除網(wǎng)頁(yè)快照

比如,有的時(shí)候百度不嚴(yán)格遵守 robots.txt 協(xié)議,可以通過(guò)百度提供的“網(wǎng)頁(yè)投訴”入口刪除網(wǎng)頁(yè)快照。百度網(wǎng)頁(yè)投訴中心:http://tousu.baidu.com/webmaster/add

如下圖是我的一個(gè)網(wǎng)頁(yè)投訴:

大概3天左右的時(shí)間過(guò)去,這個(gè)網(wǎng)頁(yè)的百度快照也被刪除,說(shuō)明此種方法也能起效,當(dāng)然這是不得而為之,屬于亡羊補(bǔ)牢。

5、補(bǔ)充更新

可以通過(guò)檢測(cè) HTTP_USER_AGENT 是否為爬蟲(chóng)/蜘蛛訪問(wèn),然后直接返回403 狀態(tài)碼屏蔽之。比如:由于api 權(quán)限與微博信息隱私保護(hù)原因,Xweibo 2.0 版本后禁止搜索引擎收錄。

關(guān)于如何屏蔽搜索引擎爬蟲(chóng)(蜘蛛)抓取/索引/收錄網(wǎng)頁(yè),您有其他什么更好的建議或者方法,也歡迎發(fā)表評(píng)論!期待與您交流。

本文作者:Bruce

原文地址:http://www.wuzhisong.com/blog/67/

?

首先,我來(lái)介紹一下什么是robots.txt:robots.txt是搜索引擎中訪問(wèn)網(wǎng)站的時(shí)候要查 看的第一個(gè)文件。Robots.txt文件告訴蜘蛛程序在服務(wù)器上什么文件是可以被查看的。當(dāng)一個(gè)搜索蜘蛛訪問(wèn)一個(gè)站點(diǎn)時(shí),它會(huì)首先檢查該站點(diǎn)根目錄下是 否存在robots.txt,如果存在,搜索機(jī)器人就會(huì)按照該文件中的內(nèi)容來(lái)確定訪問(wèn)的范圍;如果該文件不存在,所有的搜索蜘蛛將能夠訪問(wèn)網(wǎng)站上所有沒(méi)有 被口令保護(hù)的頁(yè)面。最后,robots.txt必須放置在一個(gè)站點(diǎn)的根目錄下。?

大家可以參考一下谷歌、百度和騰訊的robots寫(xiě)法:?

http://www.google.com/robots.txt?

http://www.baidu.com/robots.txt?

http://www.qq.com/robots.txt?

大家了解完robots.txt后,那么我們可以用robots.txt來(lái)做什么??

1、用robots.txt屏蔽相似度高的頁(yè)面或沒(méi)內(nèi)容的頁(yè)面。?

我們知道,搜索引擎收錄網(wǎng)頁(yè)后,會(huì)對(duì)網(wǎng)頁(yè)進(jìn)行“審核”,而當(dāng)兩個(gè)網(wǎng)頁(yè)的相似度很高時(shí),那么搜索引擎就會(huì)刪除掉其中一個(gè),并且會(huì)降低一點(diǎn)你網(wǎng)站的得分。?

假設(shè)以下這兩個(gè)鏈接,內(nèi)容其實(shí)差不多,那么第一個(gè)鏈接就應(yīng)該屏蔽掉。?

/XXX?123?

/123.html?

像第一個(gè)的鏈接這樣的鏈接非常多,那么我們要怎么屏蔽呢?其實(shí)只要屏蔽/XXX?就可以屏蔽所有的鏈接了。?

代碼如下:?

Disallow: /XXX??

同理,一些沒(méi)有內(nèi)容的頁(yè)面我們也可以利用相同的辦法將其屏蔽掉。?

2、用robots.txt屏蔽多余的鏈接,一般保留靜態(tài)的鏈接(既HTML、htm、shtml等)。?

由于網(wǎng)站中經(jīng)常會(huì)出現(xiàn)多個(gè)鏈接指向同一個(gè)頁(yè)面的情況,而這樣會(huì)讓搜索引擎對(duì)網(wǎng)站的友好度降低。為了避免這一個(gè)情況,我們就可以通過(guò)robots.txt把 非主要的鏈接去掉。

比如以下兩個(gè)鏈接指向同樣的頁(yè)面:?

/OOO?123?

/123.html?

那么我們就應(yīng)該去掉第一個(gè)垃圾,代碼如下:?

Disallow: /OOO?123?

3、用robots.txt屏蔽死鏈?

死鏈就是曾經(jīng)存在的網(wǎng)頁(yè),因?yàn)楦陌婊蚱渌蚨バв煤缶妥兂伤梨?#xff0c;也就是說(shuō)看似一個(gè)正常的網(wǎng)頁(yè)鏈接,但點(diǎn)擊后不能打開(kāi)相對(duì)應(yīng)的網(wǎng)頁(yè)頁(yè)面。?

比如,原來(lái)在目錄為/seo下的所有鏈接,因?yàn)槟夸浀刂返母淖?#xff0c;現(xiàn)在都變成死鏈接了,那么我們可以用robots.txt把他屏蔽掉,代碼如下:?

Disallow: /seo/?

4、告訴搜索引擎你的sitemap.xml地址?

利用robots.txt可以告訴搜索引擎你sitemap.xml文件的地址,而不需要在網(wǎng)站上添加sitemap.xml的鏈接。具體代碼如下:?

Sitemap: 你的sitemap地址?

以上就是robots.txt的基本用法,一個(gè)好的網(wǎng)站必定會(huì)有一個(gè)好的robots.txt,因?yàn)閞obots.txt是搜索引擎了解你網(wǎng)站的一 個(gè)途徑。另外在這里我推薦一下一個(gè)比較適合wordpress用戶(hù)使用的robots.txt寫(xiě)法:?

User-agent: *?

Disallow: /wp-?

Disallow: /feed/?

Disallow: /comments/feed?

Disallow: /trackback/?

Sitemap: http://rainjer.com/sitemap.xml?

最后,如果你覺(jué)得上面所說(shuō)的還不能滿(mǎn)足你的需要,那么你可以在谷歌或百度官方提供的robots.txt使用指南學(xué)習(xí):?

百度:http://www.baidu.com/search/robots.html?

谷歌:http://www.google.com/support/forum/p/webmasters/thread?tid=4dbbe5f3cd2f6a13&hl=zh-CN

總結(jié)

以上是生活随笔為你收集整理的如何避免搜索引擎爬虫产生的流量过大以及搜索引擎设置优化的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

久久婷婷亚洲 | 中文字幕人成人 | 午夜精品视频一区 | 久久久久久久久综合 | 天天综合网久久综合网 | 日韩欧美91 | 免费观看v片在线观看 | 97电影手机版 | 一本一道久久a久久精品 | 人人插人人插 | 久久久免费国产 | 中文字幕在线观看2018 | 99精品视频网 | 国产精品永久久久久久久www | 五月婷婷电影网 | 天天色天天上天天操 | 精品久久久久久电影 | 国产精品一区二区吃奶在线观看 | 欧美性大胆 | 五月婷婷黄色网 | 日韩中文字幕亚洲一区二区va在线 | 操操操av | 日韩精品视频在线观看免费 | 九色精品免费永久在线 | 中文字幕在线一区观看 | 涩涩网站在线看 | 97超碰中文字幕 | 久久人人97超碰com | 毛片一区二区 | 在线精品观看国产 | 在线免费观看黄色av | 欧美日韩精品在线视频 | 91高清不卡 | 婷婷在线观看视频 | 探花视频在线版播放免费观看 | 99热精品在线观看 | 国产一级视频免费看 | 91在线欧美 | 精品影院一区二区久久久 | 国产大陆亚洲精品国产 | 日韩中文字幕免费视频 | 久久99国产综合精品 | 五月天色综合 | 日韩啪啪小视频 | 一区三区视频 | 97超碰色偷偷 | 亚洲片在线 | 国产高清在线看 | 国偷自产视频一区二区久 | 超碰成人av | 国产在线播放观看 | 天天操夜夜操天天射 | 国产精品久久久久久久久久久不卡 | 亚洲视频999 | 日韩中文字幕91 | 国产福利专区 | 欧美色综合 | 国产日韩在线一区 | 久草精品视频 | 天堂av在线中文在线 | 国产精品一区二区电影 | 最新国产福利 | 国产一级电影网 | 99爱视频在线观看 | 国产高清日韩 | 欧美日韩后 | 毛片网站在线看 | 99视频在线播放 | 午夜美女视频 | 精品特级毛片 | 国产免费一区二区三区最新 | 一区二区三区免费在线播放 | 国产精品免费视频观看 | 激情丁香综合 | 中文字幕精| 亚洲国产欧洲综合997久久, | 高清视频一区二区三区 | 天天射,天天干 | 国产精品18久久久久久首页狼 | 在线视频 影院 | 国产精品18久久久久久久 | 久草青青在线观看 | 正在播放一区二区 | 美女免费网站 | 在线观看视频免费播放 | 极品久久久久久久 | 亚洲综合爱 | 日韩高清一 | 国产免费又黄又爽 | 久久久久久久久国产 | 九九精品毛片 | 中文字幕成人网 | 国产美女视频网站 | 网站在线观看日韩 | 午夜视频在线观看一区二区 | 999国产精品视频 | 狠狠久久| 国产黄a三级三级 | 99久久婷婷| 97超碰资源网 | www.黄色小说.com | 亚洲视频一区二区三区在线观看 | 日韩欧美精品一区 | 久久综合九色综合欧美就去吻 | 国产成人一区二区三区 | 夜色在线资源 | 91视频在线 | 2019中文在线观看 | 久久久久久久久久亚洲精品 | 亚洲精品视频网址 | 久久视频二区 | 国产成人一区二区三区久久精品 | 久久精品香蕉 | www.天天操 | 国产一区国产精品 | 狠狠躁夜夜躁人人爽超碰91 | 久久乐九色婷婷综合色狠狠182 | 国产韩国日本高清视频 | 一区二区久久久久 | 婷婷av综合| 国产一二三区在线观看 | 久久五月天婷婷 | 久久免费成人精品视频 | 精品国产观看 | 亚洲午夜精品久久久久久久久 | 久久免费av电影 | 久久综合99| 欧美一级特黄aaaaaa大片在线观看 | 日本高清免费中文字幕 | 久久精品国产成人精品 | 日韩中文字幕免费在线播放 | 美女久久久 | 国产精品久久久久久久久久白浆 | 欧美色一色 | 国产福利一区二区三区在线观看 | 久久久黄色av | 国产国产人免费人成免费视频 | 久久免费国产 | 99超碰在线播放 | 欧美 亚洲 另类 激情 另类 | 国产在线欧美日韩 | 日本中文字幕在线视频 | 久久久久免费精品国产小说色大师 | 又色又爽的网站 | 国产精品人人做人人爽人人添 | 激情图片久久 | 亚洲一区日韩精品 | 天天综合狠狠精品 | 丁香婷婷社区 | 久久久久观看 | 91视频在线播放视频 | 欧美福利久久 | 久草视频在线免费看 | 久久国产精品视频观看 | 麻豆免费精品视频 | 天天拍天天爽 | 国产精品国产三级国产aⅴ入口 | 蜜臀aⅴ精品一区二区三区 久久视屏网 | 丝袜+亚洲+另类+欧美+变态 | 亚洲视频在线观看 | 在线观看福利网站 | 天天操天天操天天操 | 国产黄免费在线观看 | 天天艹日日干 | 久久麻豆视频 | 在线韩国电影免费观影完整版 | 国产人成免费视频 | 国产精品99久久免费观看 | 1024手机看片国产 | 国产日产精品一区二区三区四区的观看方式 | 久久资源在线 | 韩国av一区二区三区在线观看 | 亚洲 在线| 天天干天天草天天爽 | 91精选在线观看 | 久久在线视频精品 | 日韩视频中文 | 公开超碰在线 | 欧美在线一二 | 一区二区伦理 | 久久精品网站免费观看 | 久久久久久久久久久久久久av | 中文字幕免费一区 | 国产在线91精品 | 乱男乱女www7788 | 夜夜操天天操 | www色网站| 2017狠狠干 | 亚洲国产剧情 | 黄色大片日本 | 国产精品完整版 | 91视频麻豆 | 欧美视频18 | 韩国av电影网 | 91资源在线播放 | 国产理论免费 | 国产资源精品在线观看 | 国产精品免费人成网站 | 色婷婷激情四射 | 日韩在线视频一区二区三区 | 中文字幕在线播出 | 欧美污网站 | 国产一区二区三区四区大秀 | 高清在线观看av | 黄色国产区 | 婷婷丁香在线视频 | 黄色免费网 | 久草在线综合网 | v片在线看 | 97夜夜澡人人双人人人喊 | 亚洲国产三级在线 | 国产黄在线播放 | 免费看av片网站 | 免费网站观看www在线观看 | 日韩理论电影在线 | 国产白浆视频 | 天天色天天射天天操 | 久久国内精品视频 | 在线成人av| 国产你懂的在线 | 国产精品一区二区在线观看免费 | 国产精品成人免费精品自在线观看 | 中字幕视频在线永久在线观看免费 | 亚洲精品在线一区二区 | 五月天久久精品 | 日韩精品免费在线播放 | 一区 二区 精品 | 国产免费观看高清完整版 | 日韩电影中文 | 91亚色视频| 精品超碰 | 97成人在线观看视频 | 在线a视频免费观看 | 日韩簧片在线观看 | 免费视频成人 | 日日夜日日干 | www.夜夜骑.com | 在线 你懂 | 日日躁夜夜躁aaaaxxxx | av黄色免费在线观看 | 亚洲深夜影院 | 国产 日韩 欧美 自拍 | 天天操天天添天天吹 | 亚欧日韩av | 免费看黄视频 | 92av视频| 国产高清在线免费视频 | 人人爽久久涩噜噜噜网站 | 韩日av一区二区 | 久久视频这里有久久精品视频11 | 69视频网站| av一级免费 | 国产精品高潮呻吟久久av无 | 久久免费99 | 色多视频在线观看 | 免费看日韩 | 国产免费又粗又猛又爽 | 国产精品欧美在线 | 欧美aa在线| 99精品久久只有精品 | 男女精品久久 | 国产福利中文字幕 | 菠萝菠萝在线精品视频 | 久久精品久久99精品久久 | 欧美性一级观看 | 精品无人国产偷自产在线 | av电影中文字幕在线观看 | 天堂av免费观看 | 欧美福利片在线观看 | 婷婷色网视频在线播放 | 欧美日韩p片 | 成人免费xxxxxx视频 | 亚洲精选在线观看 | 欧美性另类 | 天天爱天天射天天干天天 | 中文字幕 第二区 | 精品二区久久 | 天天插一插| 97韩国电影 | 91久久久久久久 | 国产一区二区在线观看视频 | 国产精品国产精品 | 一区二区三区在线影院 | 免费大片av | 久久精品国产一区二区 | 国产18精品乱码免费看 | 免费视频一区二区 | 欧美精品在线观看免费 | 日韩在线 一区二区 | av电影久久 | 在线观看mv的中文字幕网站 | 久久久精品国产免费观看一区二区 | 久热免费| 深爱激情五月综合 | 久久久麻豆精品一区二区 | 在线观看免费高清视频大全追剧 | 国产一级二级视频 | 中文 一区二区 | 天天色天天骑天天射 | 国产精品a级| 亚洲精品乱码久久久久久久久久 | 黄色一级在线视频 | 国产精品美女久久久久久免费 | 国产超碰在线观看 | 日韩欧美精品在线 | 久久久久久久久久电影 | 亚洲自拍自偷 | 97热视频 | 五月开心六月婷婷 | 91av原创| 国产精品国产三级在线专区 | 成人av动漫在线 | 日韩视频一 | 性色av一区二区三区在线观看 | 亚洲婷婷免费 | 日韩午夜av| 91看片看淫黄大片 | 成人超碰97 | 2022久久国产露脸精品国产 | 久久激情视频 久久 | 欧美一区二区三区不卡 | 国产打女人屁股调教97 | 久草新在线 | 久久久久国 | 中文字幕免费高清在线观看 | 国产中文字幕视频在线观看 | 99成人免费视频 | 免费试看一区 | 国产丝袜 | www.99久久.com| 欧美亚洲国产一卡 | 天天射,天天干 | 九色91福利 | 国内精自线一二区永久 | 亚洲国产成人在线观看 | 992tv人人草 黄色国产区 | 91亚洲狠狠婷婷综合久久久 | 国产成人精品一区二区三区福利 | 国产亚洲在线 | 日韩电影在线一区 | 伊人va | 亚洲精品视频在线观看视频 | 亚洲天堂视频在线 | 国产91丝袜在线播放动漫 | 97在线观看免费高清完整版在线观看 | av成人在线看 | 国产在线观看99 | 日韩在线观看视频一区二区三区 | 天天干天天玩天天操 | 五月天视频网站 | 一区二区三区四区免费视频 | 中文av在线免费观看 | 91成人免费电影 | 成人午夜电影在线观看 | 国产精品一区久久久久 | 激情视频免费在线 | 999久久国产精品免费观看网站 | 欧美国产日韩在线观看 | 亚洲欧洲成人精品av97 | 欧美极品在线播放 | 国产片网站| 超碰在线99 | 五月婷婷欧美视频 | 黄色在线观看www | av短片在线 | 国产美女精品视频 | 亚洲精品福利在线观看 | 天堂av在线中文在线 | 国产另类xxxxhd高清 | 人人看97 | 丁香电影小说免费视频观看 | 国产91电影在线观看 | 午夜久久影院 | av免费看电影 | 成人污视频在线观看 | 97色资源 | 欧美人人 | 天天射天天射天天 | 一区二区三区四区五区在线视频 | 国产精品九九久久99视频 | 成人av动漫在线 | 91最新地址永久入口 | 久久尤物电影视频在线观看 | 国产精品99精品 | 97香蕉久久超级碰碰高清版 | 少妇bbw揉bbb欧美 | 麻豆影视在线免费观看 | 91中文在线视频 | 九九热在线免费观看 | 黄色小网站在线 | 美女免费视频黄 | 美女视频a美女大全免费下载蜜臀 | 亚洲国产精品成人va在线观看 | 国产在线日本 | 国产免费观看久久黄 | 日韩天天综合 | 亚洲国产精品资源 | 久久99国产精品 | 国产精品igao视频网入口 | 天堂v中文| 在线视频久久 | 久久夜夜夜 | 国产一二三四在线视频 | 国产91成人 | 国产亚洲久一区二区 | 亚洲毛片一区二区三区 | 日产av在线播放 | 九九在线视频 | 欧美淫aaa免费观看 日韩激情免费视频 | 国产91小视频 | 久久精品综合视频 | 99久久久国产精品免费99 | 色综合久久综合中文综合网 | 国产资源在线免费观看 | 射综合网 | 欧美一区视频 | 色婷婷婷 | 国产精品久久久久久久久久白浆 | 在线影院av | 亚洲成人精品在线观看 | 欧洲精品视频一区二区 | 欧美91精品久久久久国产性生爱 | avcom在线 | 男女视频久久久 | 久久久久国产精品厨房 | 最近中文字幕国语免费av | 国产精品高潮在线观看 | 国产一区二区三区高清播放 | 亚洲综合在 | 色激情在线 | 成人在线视频论坛 | 黄色av大片 | 玖玖爱国产在线 | 国产原厂视频在线观看 | 天天操天天干天天爱 | av大全在线 | 久久久精品免费观看 | 亚洲精品久久久久中文字幕二区 | 中文字幕 第二区 | 又黄又爽又色无遮挡免费 | 国产精品麻豆视频 | 欧美日韩精品在线播放 | 亚洲国产精品一区二区久久,亚洲午夜 | 国产麻豆精品95视频 | 亚洲国产一区二区精品专区 | 一区 二区电影免费在线观看 | 在线你懂| 国产成人一区二区三区影院在线 | 国产精品久久久久999 | 免费看黄色91| 欧美日韩精品久久久 | 成人av片免费观看app下载 | 韩国av一区二区 | 精品国产激情 | 午夜影院先 | 高清av网站 | 日韩激情影院 | 欧美a级免费视频 | 黄色亚洲精品 | 九九热精品视频在线播放 | 日日草夜夜操 | 日韩av高潮 | 中文字幕在线观看视频免费 | 天天操天天干天天综合网 | 91精品视频一区二区三区 | 91网免费观看 | 日韩天天干| 国产精品免费不卡 | 日韩久久精品一区二区三区 | 国产精品观看在线亚洲人成网 | 国产视频一 | 日本三级久久 | 欧美美女一级片 | 亚洲91中文字幕无线码三区 | 国产资源中文字幕 | 国产精品一区在线观看 | 久久国产露脸精品国产 | 综合激情av | 国产1区在线 | 美女视频黄是免费的 | 成人免费av电影 | 精品99在线视频 | 日韩视频中文字幕在线观看 | 国产97视频 | 九九影视理伦片 | 黄色av网站在线观看 | 国产高清视频免费 | 91精品国产麻豆国产自产影视 | 成年人视频在线免费观看 | 国产精品高潮在线观看 | 精品久久久久久久久亚洲 | 欧美日韩天堂 | 韩国av电影网 | 天天激情综合 | 天天草天天干天天 | 国产传媒一区在线 | 激情六月婷婷久久 | 婷婷六月天天 | 久久这里只有精品首页 | 最近的中文字幕大全免费版 | 欧美一级片在线播放 | 99r在线播放 | 在线99热| 欧美性视频网站 | 2019天天干天天色 | 日韩三级视频在线观看 | 亚洲视频在线观看网站 | 国产精品女主播一区二区三区 | 色噜噜噜噜 | 9999国产| 天天操天天摸天天射 | 五月综合 | 久久国语露脸国产精品电影 | 国产一卡二卡在线 | 国产成人av综合色 | 国产精品久久在线 | av官网在线 | 日韩精品视频网站 | 天天色天 | 久久经典视频 | 五月天免费网站 | 免费观看版 | 激情久久伊人 | 美国av片在线观看 | 中文字幕av一区二区三区四区 | 超碰97中文| 9草在线 | 国产精品女主播一区二区三区 | 91精品视频在线观看免费 | 在线电影 一区 | 亚洲视频资源在线 | 不卡的av在线播放 | 国产精品99视频 | 久久久精品视频网站 | 99热精品国产一区二区在线观看 | 久久这里只有精品1 | 亚洲一本视频 | 日韩中文字幕免费看 | 操操综合 | 99久久精品国产免费看不卡 | 最近免费中文字幕大全高清10 | 中文字幕免费国产精品 | 日本婷婷色 | av免费网页 | 九九视频网站 | 最新一区二区三区 | 右手影院亚洲欧美 | 国产最新视频在线观看 | 丁五月婷婷 | 久久午夜国产精品 | 97人人精品 | 一级一片免费观看 | 六月丁香激情网 | 国产免费人人看 | 天天爽夜夜爽人人爽一区二区 | 公开超碰在线 | 久操操| 日本精品午夜 | 人人澡人人模 | 亚州av一区 | 国产麻豆精品免费视频 | 夜色.com| 久久精品视频3 | 婷婷在线资源 | 国产精品久久久久久久婷婷 | 人人射人人爽 | 五月天激情综合 | 片黄色毛片黄色毛片 | 精品理论片 | 亚洲精品欧洲精品 | 午夜精品久久久久久久99无限制 | 夜夜躁日日躁狠狠久久88av | 色综合五月天 | 久久精品亚洲精品国产欧美 | 一区二区三区精品在线 | 性色av免费看 | 美女精品网站 | 日韩资源在线播放 | 中文字幕 婷婷 | 欧美一级在线观看视频 | 麻豆成人小视频 | 成人av影视在线 | 91最新视频 | 久久久久久久久久久国产精品 | 91精品国产乱码久久桃 | 国产高清免费视频 | 亚洲第一成网站 | 国产精品久久久久久久免费 | www五月| 欧美大片第1页 | 午夜国产福利在线 | 国产黄色av影视 | 亚洲精品欧美成人 | 五月婷婷一区二区三区 | 草久在线播放 | 最新国产中文字幕 | 国产精品女教师 | 一级片免费观看 | 成人理论电影 | 欧美日韩精品在线一区二区 | 成人黄色毛片视频 | 日韩首页 | 欧美精品亚洲精品日韩精品 | 久草视频视频在线播放 | 久久,天天综合 | av在线激情 | 日韩在线视频免费播放 | 欧美不卡视频在线 | 亚洲黄色小说网 | 深夜免费福利视频 | 在线有码中文字幕 | 婷婷婷国产在线视频 | free. 性欧美.com| 国产中文字幕视频 | 免费在线观看污网站 | 91精品人成在线观看 | 国产综合福利在线 | 久久久久久久久久免费 | 婷婷精品视频 | 国产精品日韩欧美一区二区 | 欧美日韩中文在线视频 | 99久久精品免费看国产一区二区三区 | 丁香视频在线观看 | 日日干天天插 | 国产视频二区三区 | av成人亚洲| 国产97色在线 | 欧美一区三区四区 | 国产69精品久久99的直播节目 | 黄色毛片大全 | 国产在线精品一区二区三区 | www.人人草 | 天天爱天天 | 天天干夜夜爽 | 日韩成人免费观看 | 国产精品久久久久久久久久免费 | 国产九九热视频 | 中文字幕国产精品一区二区 | 国产主播大尺度精品福利免费 | 国产亚洲综合性久久久影院 | 天天干天天拍 | 香蕉视频18| 国产精品一区二区免费视频 | 天天爱天天爽 | 久久免费视频这里只有精品 | 亚洲一区精品二人人爽久久 | 97免费在线观看视频 | 中文字幕资源网在线观看 | 亚洲经典视频在线观看 | 九九九九九九精品任你躁 | 色九九影院 | 久久免费看a级毛毛片 | 在线观看免费黄视频 | 国产黄色片免费观看 | 五月婷婷中文网 | 最新日韩在线观看 | 99久久婷婷国产精品综合 | 国产经典av| 久久另类视频 | 精品久久久久久一区二区里番 | 久久免费视频7 | 91精品视频导航 | 久久精品国产亚洲aⅴ | 日本最新一区二区三区 | 日韩电影久久久 | 欧美一二三四在线 | 久产久精国产品 | 日韩免费不卡视频 | 亚洲乱码一区 | 91女子私密保健养生少妇 | 天天草夜夜 | 伊人狠狠操 | 在线成人免费av | 日韩免费看的电影 | 欧美国产日韩在线视频 | 久久伊人精品一区二区三区 | 国产视频1区2区 | 色偷偷88欧美精品久久久 | 99视频在线免费观看 | 日韩免费在线播放 | 国产乱对白刺激视频在线观看女王 | 在线影院 国内精品 | 国产成人在线免费观看 | 91视频观看免费 | 国产 一区二区三区 在线 | 888av| 九色精品免费永久在线 | 国产一区二区不卡视频 | 日韩高清免费在线 | 中文在线免费一区三区 | 91一区啪爱嗯打偷拍欧美 | 精品久久精品 | 超碰资源在线 | 又黄又爽免费视频 | 一区二区久久 | 日日色综合 | 探花视频在线观看+在线播放 | 免费涩涩网站 | 欧美色图另类 | 国产永久网站 | av网站手机在线观看 | 激情综合色综合久久综合 | 国产最新精品视频 | 国产成人精品a | 中文超碰字幕 | 四虎在线免费 | 人人爽人人乐 | 婷婷国产v亚洲v欧美久久 | 91在线91拍拍在线91 | 天天操天天干天天干 | 日韩精品不卡在线 | 狠狠操导航 | 人成在线免费视频 | www.五月激情.com| 69国产盗摄一区二区三区五区 | 国产成人精品综合久久久久99 | 日韩欧美在线中文字幕 | 日韩免费视频一区二区 | 最近av在线 | 国产在线精品区 | 国产精品2019 | 精品久久久成人 | 精品亚洲一区二区三区 | 久久久久久久久久电影 | 久久国产精品99精国产 | 国产成a人亚洲精v品在线观看 | 日韩a在线| 国产黄影院色大全免费 | 综合色天天 | 天堂av最新网址 | 久av在线| 黄色三级av | 成人免费一区二区三区在线观看 | 天天拍天天爽 | 亚洲精品av中文字幕在线在线 | 色在线视频 | 免费看一级特黄a大片 | 国产日韩欧美网站 | 亚av在线| 国产一级二级三级在线观看 | 亚州精品在线视频 | 一级特黄aaa大片在线观看 | 国产精品一区二区62 | 99热在线观看 | 欧美电影黄色 | 国产成人精品综合久久久 | 免费高清无人区完整版 | 亚洲黄色免费电影 | 黄色片亚洲 | 人人添人人澡人人澡人人人爽 | 色综合欧洲 | 日韩精品中文字幕久久臀 | 亚洲国产精品电影在线观看 | 99热最新 | 69av免费视频 | 亚洲国产wwwccc36天堂 | 成人在线观看资源 | 日韩在线观看视频一区二区三区 | 国产精品视频你懂的 | 在线国产激情视频 | 日韩在线不卡 | 天天综合天天做天天综合 | 久久一精品 | 91免费国产在线观看 | 欧美一级小视频 | aa级黄色大片 | 正在播放国产精品 | 最新av在线播放 | 国产麻豆电影在线观看 | 国产精品黄色 | 久久亚洲区 | 久久色视频 | 久久久精品欧美一区二区免费 | 日韩欧美在线免费 | 久久亚洲人 | 日韩理论影院 | 一级免费观看 | 国产精品综合av一区二区国产馆 | 最近中文字幕免费观看 | 久久你懂得 | 国产成人精品久久二区二区 | 精品视频在线免费 | a一片一级 | 日韩电影中文,亚洲精品乱码 | 久草在线在线视频 | 在线观看国产一区 | 国产精品久久久久久超碰 | 99久久久国产免费 | 亚洲国产欧美在线人成大黄瓜 | 香蕉视频最新网址 | 国产一级淫片在线观看 | 欧美成人xxx | 五月婷亚洲 | 久草91视频| 黄色官网在线观看 | 国产精品黄色 | 97精品国产97久久久久久春色 | 国产九九精品视频 | 国产精品午夜在线观看 | 成人午夜黄色 | www.888.av| 婷婷六月色 | www.夜色.com| 亚洲一区日韩精品 | 99久久精品久久亚洲精品 | 国产精成人品免费观看 | 日韩免费观看视频 | 国产亚洲精品美女久久 | 亚洲人成网站精品片在线观看 | 狠狠干综合网 | 成年人在线播放视频 | 久久av电影 | 欧美成人性战久久 | 婷婷五月情 | 狠狠狠狠狠狠狠 | 丁香高清视频在线看看 | 中文字幕一区二区三区视频 | 国产高清免费在线播放 | 一区二区三区日韩视频在线观看 | 91精品在线观看入口 | 久久九九久久精品 | 激情五月综合 | 日韩av不卡在线播放 | 亚洲国产精选 | 一本大道久久精品懂色aⅴ 五月婷社区 | 国产资源免费在线观看 | 最近日本韩国中文字幕 | 国产欧美精品一区二区三区 | 一区二区三区电影大全 | 激情欧美一区二区免费视频 | 久久久久久久久毛片 | 国产成人福利片 | 91久久黄色 | 国产精品久久久久久久免费大片 | 超碰97人人射妻 | 亚洲天堂毛片 | 最新超碰在线 | 亚洲成人av在线播放 | 一区二区伦理 | 黄色在线观看www | 色婷婷啪啪免费在线电影观看 | 日韩中文字幕免费 | 色综合久久久久 | 婷婷色综合网 | 国产精品乱码久久 | 一区二三国产 | av久久在线 | 91成人免费观看视频 | 在线观看黄色大片 | 久久综合九色九九 | 91最新视频在线观看 | 在线观看视频你懂得 | 日韩国产精品久久 | 亚洲精品中文在线观看 | 麻豆成人网| 韩国av免费看 | 色www.| 国产精品s色 | 久久福利国产 | 日日夜夜精品视频天天综合网 | 色吊丝av中文字幕 | 视频福利在线观看 | 天天看天天干天天操 | 久久99精品波多结衣一区 | 久草在线最新 | 7777xxxx| 美女久久网站 | 久久亚洲综合国产精品99麻豆的功能介绍 | 国产日韩视频在线播放 | 欧美另类老妇 | 国产精品大尺度 | 毛片基地黄久久久久久天堂 | 久久久久久久av | 国产免费中文字幕 | 美女国产精品 | 国产日产精品一区二区三区四区 | 国产资源中文字幕 | 麻豆成人网 | av在线免费播放 | 操操操综合 | 91黄色视屏 | 国产三级精品在线 | 午夜体验区 | 亚洲精品日韩在线观看 | 草在线| 成人网页在线免费观看 | 国产麻豆电影在线观看 | 美女网站在线免费观看 | 天天爽夜夜爽人人爽一区二区 | bbbbb女女女女女bbbbb国产 | 欧美一区视频 | 日韩在线理论 | 欧美激情综合五月 | 久久伊人热 | 91黄色在线看 | 天天干天天做天天爱 | 91精品国自产在线偷拍蜜桃 | av免费观看高清 | 在线观看亚洲精品视频 | 国产手机视频 | 中文字幕色婷婷在线视频 | 国产三级精品三级在线观看 | 色婷婷狠狠| 四虎成人精品永久免费av | 久久五月婷婷综合 | 久久夜色电影 | 久久婷婷精品视频 | 成年人电影免费看 | 在线观看www视频 | 欧美一级乱黄 | 精品久久久久久久久久久久 | 在线久草视频 | 久久夜色精品国产欧美乱 | 香蕉视频在线观看免费 | 色综合久久88色综合天天 | 麻豆观看 | 麻豆一区二区 | 91黄色免费看 | a级免费观看 | 国产精品成人免费精品自在线观看 | 久久天| 亚洲网站在线 | 三级黄色免费片 | 韩国精品一区二区三区六区色诱 | 激情五月婷婷激情 | 亚洲高清在线观看视频 | 天天亚洲综合 | 日韩精品一区二区免费 | 免费a级黄色毛片 | 99国内精品久久久久久久 | 亚洲精选视频在线 | 天天爱天天色 | 少妇bbbb搡bbbb桶| www天天干com | 美女网站视频久久 | 91九色porny蝌蚪视频 | 国产精品观看在线亚洲人成网 | 日韩欧美在线中文字幕 | 久久永久免费视频 | 久草在线在线精品观看 | 一区二区在线影院 | 欧美精品天堂 | 日韩中文字幕在线不卡 | 日本美女xx| 五月婷婷综合在线视频 | 天天插夜夜操 | 操操操综合 | 免费又黄又爽视频 | 免费三级a | 午夜国产影院 | 免费在线观看成人小视频 | 国产黄免费| 精品久久久久久久久久久院品网 | 国产中文字幕av | www日韩视频 | 国产精品一区二区 91 | 亚洲永久国产精品 | 插插插色综合 | 麻豆av电影| 国产黑丝一区二区 | 国产福利a| 久久国产精品免费一区 | 一区二区三区国产欧美 | 伊人激情网 | 成人免费网视频 | 日色在线视频 | 96视频在线 | 夜色成人网 | 欧美日韩精品在线观看视频 | av网站在线观看播放 | 免费精品在线观看 | 婷婷丁香色综合狠狠色 | 国产黄色片久久久 | www.夜夜操.com | 天天干天天操天天搞 | 日韩在线第一区 | 日韩天天综合 | 五月婷婷狠狠 | 97超碰人人爱 | 一区 在线观看 | 久久亚洲欧美日韩精品专区 | 91 中文字幕 | 欧美aa在线 | 国产一区二区在线播放 | 久久成人免费视频 | av网址最新 | 日本爱爱免费 | 久久手机免费视频 | 国产视频在线免费 | 欧美日韩精品在线观看 | 国产精品门事件 | 欧洲亚洲女同hd | 精品久久久久久国产偷窥 | 日韩欧美精品一区二区三区经典 | 国产一级特黄毛片在线毛片 | 国产成人久久精品77777 | 五月天久久狠狠 | 亚洲国产精品成人精品 |