在做网站优化的时候站长们经常会遇到各种各样的问题,比如百度蜘蛛爬取频率低,或者不再进行爬取,出现304返回码等等,这里 郑州蓝天网络网站优化就来谈谈这些问题;
网站更新的越频就越能被搜索引擎所关注,通过一定时间里对网站提取回复的提示码来调整对网站的抓取频率.如果网站一直处于[304:无改动]的状态下,这可能会使引擎爬虫误判导致对网站的抓取率减少,总之,如果网站更新的频繁,使爬虫每次都能获取新的信息,那么久而久之爬虫再次返回的几率也会跟着提高.
不管是抓取率低或者是304,这些都属于一种现象,但却不是问题的原因,即便网站的收到的回复码都是200,也未必能让排名上升带来流量,对比下更应该好好想想为什么会出现304?,对于网站而言改304会有什么效果呢?不能无视总体的目标而强调过程的细节,为了200而去解决304.
304的状态是怎么出现的?
服务器为提升网站访问的速度,对原来已经访问过的部分页面有缓存的能力,当客户端对这些页面进行访问请求时,服务器就会根据这些缓存对照页面是不是和以前是一样的,如果是同样的就会回复304,此时客户端就会使用缓存的内容,不会再次进行下载,从某种角度看来304也是一种减少服务器带宽提高蜘蛛爬行的机制.
引起304状态的原因?
1 页面内容更新的频率低或者不更新
2 纯静态页面内容或者是强制生产静态html
处理304状态的方案?
1 对会产生304的页面做仔细的分类,到底哪些页子需要回复304?哪些页子不需要回复304?
2 这些页子是通过什么样的生成方式?内容是否有更新机制?这种机制对应蜘蛛对网站的爬行频率?
3 页子区域位置的更新是否合理?有没有处于该页子主要的内容承载区域?
另外:304状态码还会引起下面几点问题;
1 网站快照停止
2 内容的收录减少
3 权重也会下降
SO 怎样减少304返回码呢?
首先将百度蜘蛛视为供奉,在内容更新方面迎合它,分析日志,记录下蜘蛛到来的时间,由此大概了解到蜘蛛到来的频率,而后凭这个频率更新文章:要原创+转载,不要纯采集.转载要最好最新的优质资源.将蜘蛛伺候好让它满足了才会得到更多的200正常码.
其次就是,网站最好有个互动板块,很多大型网站上都已经做了这方面的功能,如评论功能和留言功能,大网站的更新可能会很少,但是有了这种互动,用户会在这些板块上发些信息,网站就可以得到更多新东西.如seowhy.com,就是把这些信息放在了重要的位置上的.
总结
