这个概念首先要搞清楚:一张图看懂收录与索引的区别

2016-04-08seo优化
217

很多做seo的朋友一度对收录和索引的概念非常模糊,百度工程师也曾“粗暴”地说过“收录和索引是一回事”。但实际工作中,其实收录和索引都有其各自的重要意义,并不能含糊地混为一谈,于是制作了这样一张图,让大家快速了解收录与索引的区别。


1,收录和索引分别指什么
  收录:页面被Baiduspider发现、分析过
  索引:Baiduspider经初步分析后认为有意义,做建库处理

2, 收录和索引的关系
  包含关系,先收录才可以建索引,收录量大于索引量。百度站长平台链接提交工具是通往收录的大门。

3, 收录和索引的意义
  【收录意义1】收录是索引的前提,站点需要保持服务器稳定(参考抓取诊断工具、抓取异常工具)、robots正确(《robots写法和需求用法对应表》),为Baiduspider抓取铺平道路
  【收录意义2】Baiduspider只能处理已分析过的页面,面对新旧页301和移动适配,可为已收录页面完成权值评分以及流量切换

【索引意义1】只有被建入索引库的网页才有获得流量的机会(网页虽然被建入索引库,但获得流量的机会并不同,无效索引很难获得流量)
  【索引意义2】新闻源站点(新闻源目录)内的链接,必须先被网页库建索引,才有机会出现在新闻检索中

4, 如何查询收录量和索引量
  目前百度未提供查询收录的工具,任何第三方提供的所谓收录查询都是不靠谱儿的。站长可以通过LOG日志分析估算收录,注意真假Baiduspider(《如何识别百度蜘蛛》
  真实索引量只能通过百度站长平台索引量工具查询
  目前有第三方开发的工具可以辅助分析索引中页面的引流能力,如site.itseo.net(第三方工具,仅供参考) 

The End
索引 收录

相关推荐

百度对网站的抓取频次和频率低怎么解决?
我们在优化自己的网站时候,在百度站长平台看到网站的抓取频率很低,网站迟迟不收录内容,那么要怎么提升抓取频率呢? 百度蜘蛛爬行是索引和排名的基...
2023-02-25 seo优化
316

超详细robots.txt大全和禁止目录收录及指定页面
robots.txt写法大全和robots.txt语法的作用 1如果允许所有搜索引擎访问网站的所有部分的话 我们可以建立一个空白的文本文档,命名为robots.txt放在网站的根目录下即可。 robots.txt写法如下: User-agent: * Disallow: 或者 User-agent: * Allow: / 2如果我...
2017-12-19 seo优化
294

百度推出飓风算法,严厉打击恶劣采集
百度搜索于近日推出飓风算法,旨在严厉打击以恶劣采集为内容主要来源的网站,同时百度搜索将从索引库中彻底清除恶劣采集链接,给优质原创内容提供更多展示机会,促进搜索生态良性发展。 飓风算法会例行产出惩罚数据,同时会根据情况随时调整迭代,体现了百度...
2017-07-07 seo优化
321

页面长度过长,也会导致不收录?
最近院长收到一个非常典型的抓取优化例子,整理一下分享给各位,各位站长们谨记不要出现相同的情况: 站点反馈 : 网站主体内容都是 js 生成,针对用户访问,没有做优化;但是网站特针对爬虫抓取做了优化,直接将图片二进制内容放到了html中导致页面长度过长...
2017-06-21 seo优化
233

https站点如何建设才能对百度友好
2015年5月25日,百度站长平台发布公告,宣布全面放开对https站点的收录,https站点不再需要做任何额外工作即可被百度抓收。采用了本文之前建议的https站点可以关闭http版,或者将http页面跳转到对应的https页面。 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~...
2017-06-21 seo优化
157

百度链接提交主动推送后不收录的原因
自从百度站长平台开放了百度链接主动推送接口以后,很多站长都开始使用百度开放的这个主动推送接口来推送网站的最新内容,但是在使用这个推送接口的时候,大家肯定也发现了不少问题,比如推送的内容不收录、推送的链接数量 和 站长平台显示的 主动提交 数量...
2017-05-17 seo优化
289