少妇的bbw性大片,人妻放荡乱h文,青青草97国产精品免费观看,人人妻人人澡人人爽不卡视频,人妻夜夜添夜夜无码av

Menu

[官方]百度蜘蛛抓取流量暴增的原因

網(wǎng)站建設(shè) 錄入時(shí)間 2023-09-16 閱讀次數(shù) 無雙建站
  先我們來說說這兩個(gè)問題,百度是怎么計(jì)算分配抓取流量的呢?站點(diǎn)抓取流量暴增的原因有哪些呢?

  總體來說,Baiduspider會(huì)根據(jù)站點(diǎn)規(guī)模、歷網(wǎng)站每天新產(chǎn)出的鏈接數(shù)量、已抓取網(wǎng)頁(yè)的綜合質(zhì)量打分等等,來綜合計(jì)算抓取流量,同時(shí)兼顧站長(zhǎng)在抓取頻次工具里設(shè)置的、網(wǎng)站可承受的大抓取值。
百度站長(zhǎng)平臺(tái)   從目前追查過的抓取流量突增的case中,原因可以分為以下幾種:

  1、Baiduspider發(fā)現(xiàn)站內(nèi)JS代碼較多,調(diào)用大量資源針對(duì)JS代碼進(jìn)行解析抓??;
  2、百度其他部門(如商業(yè)、圖片等)的spider在抓取,但流量沒有控制好;
  3、已抓取的鏈接,打分不夠好,垃圾過多,導(dǎo)致spider重新抓??;
  4、站點(diǎn)被攻擊,有人仿冒百度爬蟲(見下文關(guān)于BaiduSpider)。

  如果站長(zhǎng)排除了自身問題、仿冒問題,確認(rèn)BaiduSpider抓取流量過大的話,可以通過百度的反饋中心(http://zhanzhang.baidu.com/feedback)反饋,注:一定要提供詳細(xì)的抓取日志截圖。

  關(guān)于BaiduSpider

  如何正確識(shí)別Baiduspider移動(dòng)ua

  新版移動(dòng)ua:

  Mozilla/5.0(Linux;u;Android4.2.2;zh-cn;)

  AppleWebKit/534.46(KHTML,likeGecko)

  Version/5.1MobileSafari/10600.6.3(compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

  PCua:Mozilla/5.0(compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

  之前通過“+http://www.baidu.com/search/spider.html”進(jìn)行識(shí)別的網(wǎng)站請(qǐng)注意!需要修改識(shí)別方式,新的正確的識(shí)別Baiduspider移動(dòng)ua的方法如下:

  1、通過關(guān)鍵詞“Android”或者“Mobile”來進(jìn)行識(shí)別,判斷為移動(dòng)訪問或者抓?。?br/>  2、通過關(guān)鍵詞“Baiduspider/2.0”,判斷為百度爬蟲。

  另外需要強(qiáng)調(diào)的是,對(duì)于robots封禁,如果封禁的agent是Baiduspider,會(huì)對(duì)PC和移動(dòng)同時(shí)生效。即無論是PC還是移動(dòng)Baiduspider,都不會(huì)對(duì)封禁對(duì)象進(jìn)行抓取。之所以要強(qiáng)調(diào)這一點(diǎn),是發(fā)現(xiàn)有些代碼適配站點(diǎn)(同一個(gè)url,PCua打開的時(shí)候是PC頁(yè),移動(dòng)ua打開的時(shí)候是移動(dòng)頁(yè)),想通過設(shè)置robots的agent封禁達(dá)到只讓移動(dòng)Baiduspider抓取的目的,但由于PC和移動(dòng)Baiduspider的agent都是Baiduspider,這種方法是非常不可取的。

  如何識(shí)別百度蜘蛛

  百度蜘蛛對(duì)于站長(zhǎng)來說可謂上賓,可是也有站長(zhǎng)會(huì)發(fā)出這樣的疑問:

  我們?nèi)绾闻袛喁偪褡ノ覀兙W(wǎng)站內(nèi)容的蜘蛛是不是百度的?

  其實(shí)站長(zhǎng)可以通過DNS反查IP的方式判斷某只spider是否來自百度搜索引擎。根據(jù)平臺(tái)不同驗(yàn)證方法不同,如linux/windows/os三種平臺(tái)下的驗(yàn)證方法分別如下:

  1、在linux平臺(tái)下,可以使用hostip命令反解ip來判斷是否來自Baiduspider的抓取。Baiduspider的hostname以*.baidu.com或*.baidu.jp的格式命名,非*.baidu.com或*.baidu.jp即為冒充。
  2、在windows平臺(tái)或者IBMOS/2平臺(tái)下,可以使用nslookupip命令反解ip來判斷是否來自Baiduspider的抓取。打開命令處理器輸入nslookupxxx.xxx.xxx.xxx(IP地址)就能解析ip,來判斷是否來自Baiduspider的抓取,Baiduspider的hostname以*.baidu.com或*.baidu.jp的格式命名,非*.baidu.com或*.baidu.jp即為冒充。
  3、在macos平臺(tái)下,您可以使用dig命令反解ip來判斷是否來自Baiduspider的抓取。打開命令處理器輸入digxxx.xxx.xxx.xxx(IP地址)就能解析ip,來判斷是否來自Baiduspider的抓取,Baiduspider的hostname以*.baidu.com或*.baidu.jp的格式命名,非*.baidu.com或*.baidu.jp即為冒充。

  BaiduspiderIP是多少

  即便很多站長(zhǎng)知道了如何判斷百度蜘蛛,仍然會(huì)不斷地問“百度蜘蛛IP是多少”。并想將百度蜘蛛所在IP加入白名單,只準(zhǔn)白名單下IP對(duì)網(wǎng)站進(jìn)行抓取,避免被采集等行為。

  百度方面表示,不建議站長(zhǎng)這樣做。雖然百度蜘蛛的確有一個(gè)IP池,真實(shí)IP在這個(gè)IP池內(nèi)切換,但無法保證這個(gè)IP池整體不會(huì)發(fā)生變化。所以,建議站長(zhǎng)勤看日志,發(fā)現(xiàn)惡意蜘蛛后放入黑名單,以保證百度的正常抓取。

  同時(shí),百度方面還強(qiáng)調(diào):通過IP來分辨百度蜘蛛的屬性是非常可笑的事情,所謂的“沙盒蜘蛛”“降權(quán)蜘蛛”等等是從來都不存在的。

【版權(quán)聲明】:本站內(nèi)容來自于與互聯(lián)網(wǎng)(注明原創(chuàng)稿件除外),供訪客免費(fèi)學(xué)習(xí)需要。如文章或圖像侵犯到您的權(quán)益,請(qǐng)及時(shí)告知,我們第一時(shí)間刪除處理!謝謝!

無雙科技
如何獲取外貿(mào)詢盤和訂單?
網(wǎng)站建設(shè)咨詢:13534259410

經(jīng)典客戶案例展示

深圳無雙科技 - 專注于高端網(wǎng)站建設(shè)、網(wǎng)站設(shè)計(jì)開發(fā)、品牌網(wǎng)站制作

咨詢電話:13534259410

售后服務(wù):13534259410  (7×24小時(shí))
在線 Q Q:253849310 (售前咨詢)

深圳網(wǎng)站建設(shè)咨詢
【掃一掃咨詢】
  • 掃一掃 在線咨詢
    無雙科技官方公眾號(hào)
  • 響應(yīng)式客戶端
    掃一掃 關(guān)注好友
體驗(yàn)創(chuàng)新服務(wù)

深圳無雙科技,專注于深圳網(wǎng)站建設(shè)、深圳網(wǎng)站設(shè)計(jì)、深圳網(wǎng)站制作。
服務(wù)客戶超3000家,一站式網(wǎng)站建設(shè)及推廣營(yíng)銷解決方案提供商。
我們的價(jià)值觀:誠(chéng)信、坦誠(chéng)、盡責(zé)、創(chuàng)新。期待與您合作!

您好,很高興為您服務(wù) ^_^