HTTPS站点如何做才能让百度蜘蛛抓取

2016-04-11seo优化
323

HTTPS站点如何做才能让百度蜘蛛抓取


我们可以根据user-agent来判断spider。然后做301/302定向,百度spider引擎定向到HTTP


非百度SPIDER 定向到HTTPS


目前百度的度各个产品使用的user-agent:


百度蜘蛛
目前有两种方法


第一种方法:可以采用.htaccess 301重定向


RewriteEngine On


# BEGIN Force SSL


RewriteCond %{HTTPS} !on [NC]


RewriteCond %{HTTP_USER_AGENT} !( baiduspider| baiduspider-image | baiduspider-video | baiduspider-news | Baiduspider-favo | Baiduspider-cpro | Baiduspider-ads | Baiduspider) [NC]


RewriteRule (.*) https://%{SERVER_NAME}%{REQUEST_URI} [R=301,NC,L]


# END Force SSL


第二种方法:php的 $_SERVER['HTTP_USER_AGENT']来进行判断 


<?php $tmp = $_SERVER['HTTP_USER_AGENT'];


if (strpos($useragent, 'baiduspider') !== false){ return 'baiduspider'; }


if (preg_match(“#(baiduspider)#si”, $_SERVER['HTTP_USER_AGENT'])) {   header(“HTTPS/1.1 301 Moved Permanently”); header(“Location: http://www.XXXXX.com/”); exit;   }}


采用HTTPS的站点都是要求安全性能的站点,所以站长还是采用形式,需要安全的站点采用二级域名,其余用目录形式表现。


The End
baiduspider

相关推荐

【官方说法】全面解读BaiduSpider与站点死链
从最近几周收到的提问看,大家对死链越来越关注,毕竟死链直接关系到网站的抓取收录和流量转化。于是我们整合了学院之前的内容,又专门对 Baiduspider 工程师进行了咨询,给大家一个完整的系列答复。 问: robots 屏蔽对阻止百度抓取死链是否有效 答:当然有...
2016-10-24 seo优化
233

【官方说法】百度蜘蛛抓取流量暴增的原因
Spider对网站抓取数量突增往往给站点带来很大烦恼,纷纷找平台想要Baiduspider IP白名单,但实际上BaiduSpider IP会随时变化,所以并不敢公布出来,担心站长设置不及时影响抓取效果。百度是怎么计算分配抓取流量的呢?站点抓取流量暴增的原因有哪些呢? 总体...
2016-09-12 seo优化
227

百度蜘蛛3.0已经更新 我们来看看到底有什么进步
百度蜘蛛(BaiduSpider) 现在已经升级为了3.0,很多站长反应其自身的网站抓取速度已经提升很多了,这到底是怎么回事呢?现在就带大家一起来看看百度的这次更新。 百度蜘蛛,简单的说:就是百度搜索引擎的一个自动抓取的程序系统。这个爬虫系统作用主要还是访...
2016-06-25 seo优化
640

BaiduSpider升级到3.0,抓取速度提升80%,你感受到了吗?
BaiduSpider升级到3.0,抓取速度提升80% Baidu Spider上一次升级还要追溯到2010年。 那个时候,中国互联网资源急剧扩张,从百亿扩大到千亿规模,因而spider系统进行了重构,从单机互联转变为分布式计算系统。 但是有一个很大的缺点:延时严重! 而此次重构是...
2016-06-24 seo优化
195