【官方说法】百度蜘蛛抓取流量暴增的原因

2016-09-12seo优化
227

Spider对网站抓取数量突增往往给站点带来很大烦恼,纷纷找平台想要Baiduspider IP白名单,但实际上BaiduSpider IP会随时变化,所以并不敢公布出来,担心站长设置不及时影响抓取效果。百度是怎么计算分配抓取流量的呢?站点抓取流量暴增的原因有哪些呢?
 
总体来说,Baiduspider会根据站点规模、历史上网站每天新产出的链接数量、已抓取网页的综合质量打分等等,来综合计算抓取流量,同时兼顾站长在抓取频次工具里设置的、网站可承受的最大抓取值。
 
从目前追查过的抓取流量突增的case中,原因可以分为以下几种:
 
1,  Baiduspider发现站内JS代码较多,调用大量资源针对JS代码进行解析抓取
 
2,  百度其他部门(如商业、图片等)的spider在抓取,但流量没有控制好,sorry
 
3,  已抓取的链接,打分不够好,垃圾过多,导致spider重新抓取
 
4,  站点被攻击,有人仿冒百度爬虫
 
如果站长排除了自身问题、仿冒问题,确认BaiduSpider抓取流量过大的话,可以通过反馈中心来反馈,切记一定要提供详细的抓取日志截图。
The End
百度蜘蛛

相关推荐

百度对网站的抓取频次和频率低怎么解决?
我们在优化自己的网站时候,在百度站长平台看到网站的抓取频率很低,网站迟迟不收录内容,那么要怎么提升抓取频率呢? 百度蜘蛛爬行是索引和排名的基...
2023-02-25 seo优化
316

【官方说法】百度蜘蛛抓取流量暴增的原因
Spider对网站抓取数量突增往往给站点带来很大烦恼,纷纷找平台想要Baiduspider IP白名单,但实际上BaiduSpider IP会随时变化,所以并不敢公布出来,担心站长设置不及时影响抓取效果。百度是怎么计算分配抓取流量的呢?站点抓取流量暴增的原因有哪些呢? 总体...
2016-09-12 seo优化
227

百度蜘蛛3.0已经更新 我们来看看到底有什么进步
百度蜘蛛(BaiduSpider) 现在已经升级为了3.0,很多站长反应其自身的网站抓取速度已经提升很多了,这到底是怎么回事呢?现在就带大家一起来看看百度的这次更新。 百度蜘蛛,简单的说:就是百度搜索引擎的一个自动抓取的程序系统。这个爬虫系统作用主要还是访...
2016-06-25 seo优化
640

HTTPS站点如何做才能让百度蜘蛛抓取
HTTPS站点如何做才能让百度蜘蛛抓取 我们可以根据user-agent来判断spider。然后做301/302定向,百度spider引擎定向到HTTP 非百度SPIDER 定向到HTTPS 目前百度的度各个产品使用的user-agent: 目前有两种方法 第一种方法:可以采用.htaccess 301重定向 Rewrit...
2016-04-11 seo优化
323