网站建设过程中,我们每天需要解决的问题就是网站百度不收录的问题,但在很长一段时间里,实际 上,我们认为,对于网站排名而言,并不是所有的页面都需要被百度建立索引进行收录的。 我们没有必要花费大量的时间去为这些页面投入资源与建立索引。 那么,网站内部,哪些页面不用被索引?
一、基础性页面
对于大量的新站,我们经常会遇到这样一个问题:那就是网站页面即使是收录了,也会存在很长时间 没有排名的情况,产生这个问题的因素有很多,比如:网站结构设计的框架过大。 但其中直观的影响因子就是:页面存在大量的无网站推广价值的链接,比如:关于我们,联系方式, 留言板等。
由于新站到访的百度蜘蛛有限,如果你将更多的抓取频次浪费在这些页面上,那么,实际有价值的页 面,就很难得到有效抓取。
二、陈旧页面
理论上我们在做整站优化的时候,我们希望站内的每一个页面都在积极地发挥着作用,但随着时间的 运营,我们一定会遇到一些陈旧性的页面,比如:
①电商网站的商品销售的过期页面(已经售空或者下架)
②内容资讯页面的旧闻。
③网络推广培训中的一些旧课程页面,早期的方法与策略,已经完全不使用。
三、聚合页面
我们知道聚合页面的作用,主要是将相关性的内容与页面整合到一起,而在实际操作中,大量的聚合 页面完全是自动生成的,其主要的目的就是满足用户在站内浏览的用户体验。 而从网站推广的角度,如果过度地利用系统程序自动生产,很可能会产生大量重复性的标签,这个时 候,就会造成内部关键词排名冲突,往往得不偿失。
四、网站翻页
网站翻页是一个我们经常讨论的话题,很长时间,我们经常忽略对站内翻页的研究,虽然随着搜索引 擎算法的不断提升,百度已经可以精准地识别翻页的首页,而尽量避免给予更多分页的排名。 这个时候我们仍然需要自己去操作,只允许搜索引擎爬行分页,而不建立其他翻页的索引,这样就不 会产生翻页之间的冲突。
你可以尝试利用两个策略:
①利用规范化标签Canonical去标注翻页的首选页面。
②利用dofollow,noindex命令,让蜘蛛只爬行,不索引。
总结:对于一个网站而言,我们不能完全要求每一个页面都得到有效的收录。