请选择 进入手机版 | 继续访问电脑版

巅峰霸主

 找回密码
 立即注册

QQ登录

只需一步,快速开始

[经验交流] 百度不收录的原因分析网站内容和各方面总结

  [复制链接] [添加相关主题]
烈火大地 发表于 2019-7-24 10:30:04 | 显示全部楼层 |阅读模式
阿里云服务器2折起!

游客只能显示部分内容,请登录后查看帖子完整内容!!!注册完全免费。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
百度不收录的原因基本上只有几种情况,除了网站内容的原因,还有页面排版、robots设置等,首先看来自百度官方的解释,【官方说法】百度不收录原因分析——spider抓取篇
目前百度spider抓取新链接的途径有两个,一是主动出击发现抓取,二就是从百度站长平台的链接提交工具中获取数据,其中通过主动推送功能“收”上来的数据最受百度spider的欢迎。对于站长来说,如果链接很长时间不被收录,建议尝试使用主动推送功能,尤其是新网站,主动推送首页数据,有利于内页数据的抓取。
那么同学们要问了,为什么我提交了数据还是迟迟在线上看不到展现呢?那涉及的因素可就多了,在spider抓取这个环节,影响线上展现的因素有:
1、网站封禁。你别笑,真的有同学一边封禁着百度蜘蛛,一边向百度狂交数据,结果当然是无法收录。
2、质量筛选。百度spider进入3.0后,对低质内容的识别上了一个新台阶,尤其是时效性内容,从抓取这个环节就开始进行质量评估筛选,过滤掉大量过度优化等页面,从内部定期数据评估看,低质网页比之前下降62%。
3、抓取失败。抓取失败的原因很多,有时你在办公室访问完全没有问题,百度spider却遇到麻烦,站点要随时注意在不同时间地点保证网站的稳定性。
4、配额限制。虽然我们正在逐步放开主动推送的抓取配额,但如果站点页面数量突然爆发式增长,还是会影响到优质链接的抓取收录,所以站点在保证访问稳定外,也要关注网站安全,防止被黑注入。
以上是百度资源平台复制的内容,源网页链接:
游客,如果您要查看本帖隐藏内容请回复


另外不收录的其他还有可能如下的情况:

1:网站空间服务器经常宕机,速度过慢等不稳定情况
搜索引擎蜘蛛类似于普通浏览IP浏览网站,如果网站本身的空间,服务器不稳定,那么对于提升搜索引擎友好度是非常不利的,站长在选择服务器的时候,一定要选择实力雄厚的空间商,切不可贪图一时便宜而追悔莫及。
2:是否错误使用robots文件
这个情况导致网站文章不被收录的概率较小,但还是会发生。很多时候,seo优化人员或站长会直接使用各大下载站提供的cms建站系统,有些已经被作者修改过,有可能robots文件有不适用本网站的情况,就有可能默认的robots文件阻止了搜索引擎对于文章内容的抓取。在此建议:网站上线之前,必须检查相关文件。
3:网站历史数据是否正常
很多站长为了节省网站优化时间,加快网站优化进度,会直接购买老域名,利用老域名的历史数据以及权重来运营新网站。殊不知老域名有不良记录如被K,长期降权等,就有可能波及新网站的文章内容收录。

4:网站本身结构不良
一般情况是,大部分网站直接使用cms建站系统做的,不存在网站结构非常糟糕的问题,但如果对程序进行二次开发,结果就不一样了,有可能出现路径过深,很多页面为“孤岛”的情况。

5:大量内容页面直接复制粘贴,无内容增溢
搜索引擎是不反对转载,甚至采集文章等方式建设网站内容的。问题在于站长在此过程中,是否对文章进行了二次加工,给内容增加了阅读价值和检索价值。如果为了收录而海量转载大量文章,有可能被判为作弊,从而造成文章不被百度等搜索引擎收录的问题。

6:文章受众过小无收录价值
这一点很多seo优化人员都不了解,受众过小意味着文章没有检索,查询价值也会造成文章内容不被收录。举一个例子,你的网站每天记录的都是日常生活的点点滴滴,对于你的家人,朋友也许是有用的,但对于海量用户来讲,这样的文章是毫无价值的,被收录的概率也会随之降低。注:如果你是名人,有搜索指数,那么你写的流水账也是有价值的,这涉及到人名,地名,或专有名词的重要性。

7:新站无权威度或处于百度考核期
新站是几乎无外链的,而外链又是权威度的重要组成部分,权威度又是网站文章是否被快速收录的一个重要因素。如果是刚成立的新站,或新站正处于百度考核期,那么网站文章内容只被索引,不被收录也很正常。

8:网站内容涉及到敏感话题
这一点造成文章不被收录的概率较低,但也会出现。如果网站存在大量涉及国家机密等内容,也有可能导致问题的发生。

9:文章内容被索引后未及时放出来
对于新上线的网站来讲,这个原因导致的文章暂时不被收录的情况最为普遍。新站上线,将网站url提交给搜索引擎后,虽然文章内容没有被收录,但实际上搜索引擎蜘蛛还是会到网站抓取内容的,只是在对新站进行考核,被索引的文章内容暂时不被放出而已。这个时间段不定,少则几天,多则一两月。在此期间发生的文章被收录后又不见了,快照停滞不前等情况是正常的,站长朋友需淡定看待结果。建议:此阶段大量添加高质量的原创或伪原创内容,适当进行外链建设吸引蜘蛛爬取网站内容,是此阶段的重要任务。

10:网站被降权导致的文章内容不被百度收录。
新站会有一段时间内不被百度收录的情况,老站由于被降权的原因导致文章内容不被收录的情况也比较普遍。网站被降权或被K后,搜索引擎会对网站本身进行再次评估,这期间内容不被收录是普遍情况。对于此问题,我们需要修改网站,将对搜索引擎不友好的因素逐个排查并修正。


上一篇:Canonical标签与301重定向的区别详解
下一篇:百度关键词工具入口在哪里SEO关键词挖掘使用方法详解
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|巅峰霸主 ( 京ICP备12023415号-2 )

声明:本站的任何信息和内容仅代表作者的立场和观点,与巅峰霸主网无关。

禁止在巅峰霸主网发布任何与《中华人民共和国法律》相抵触的言论!

GMT+8, 2019-11-12 21:18 , Processed in 0.080025 second(s), 25 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表