在网站优化过程中,搜索引擎并不喜欢重复内容的收录,一直强调的也是原创,那为什么网站同一页面还会重复收录呢?
一般后缀出现了一个问号或者其他的字符串,是因为网络收录文章的同时,会给该篇文章加一个标签,但是访问网站的时候,会自动跳转回来原来的网站,首页或者内页,至于内页的链接被收录到首页有可能是因为该篇文章设置在首页上显示,所以最终的链接地址指向了首页。
1.搜索引擎识别问题—搜索引擎毕竟只是人为编写的一套规则,做不到充分的识别,所以导致部分URL地址的内容重复收录。
2.程序设计问题—有些程序在设计中为了“预览”方便在后台存在动态页面。但因设计不当,导致搜索引擎依旧通过目录的索引便可发现这一存在,进而对其索引收录。
3.模板问题—在模板制作中常常易忽视这一问题,最后模板完成后既存在动态页面,又存在静态页面,如此怎能不被搜索引擎重复收录呢?
4.网站改版—网站改版可能会导致一些URL地址的重复收录。
可以从以下四个方面着手:
在网站建设过程中尽量统一URL地址,勿使用动态页面进行链接,一来是搜索引擎青睐静态页面,另一方面也可以防止相同内容被搜索引擎重复收录。
利用进行动态文件的屏蔽,如:“Disallow:/?”即屏蔽了根目录下带”?”的页面,这个可以自己灵活设置。
每个网站都会带有两个网址,一般网站更新文章后都需要生成静态的网址,本身就存在一个动态的,自然生成静态后就会多出一个网址,这样的话,如果没及时清除缓存,就可能使得同一个页面的静态,动态URL网址都被收录,因为这搜索引挚把同一篇文章的两个网址看作是独立的,自然就两个都被收录了。所以,及时清除缓存可以很大程度上减少网页被重复收录。
网站地图的作用不单单是把整站的内容进行归纳,而且还可以让蜘蛛爬行更加的顺畅无阻,有序的抓取网站内的各个页面,从而也能减少蜘蛛对网站页面重复收录的概率。
一、优化页面响应时间
网站页面的响应时间也就是网站的加载速度,这个问题不仅与网站设计中的图片的大小和属性相关,还与网站的格式是否规范有关。访问速度快的对企业网站流量的获得直屋非常重要的作用,也是判断一个网站好坏的标准之一。所以如果我们想要提升网页的打开速度,可以从服务器、代码优化等方面入手。
SEO在对企业网站进行优时可以查看页面状态码的返回是否正常。正常情况下应该返回200。网站http状态码的情况有:301——永久重定向;404——服务器找不到请求的网页;500——服务器遇到错误,无法完成请求等。
企业网站的缓存机制可以很好的提高网站服务器加载数据的速度。当用户在第一次访问网站时,缓存机制就会缓存站点的JS、CSS等文件,当用户第二次访问时,服务器就可直接从缓存中加载网站数据,而不需要再花时间用服务器端进行数据加载。
使用GZIP压缩技术也是一种能让用户感受网站加载速度变快的方法,其原理是:在用户访问网站时,服务器能将网页内容压缩后传输到用户的电脑浏览器中,这样就可以大大提升网站的打开速度。
网上有一些批评wp-super-cache插件的声音,他们认为cos-html-cache或Hyper Cache两款插件优于wp-super-cache。
还有人说使用缓存插件会降低网页速度等,ip至少要大于5000等。
个人不敢苟同,我认为是他们不会使用强大的新版wp-super-cache插件,新版本中加入新选项,对搜索引擎seo更为有利。
相比其他wordpress缓存插件,wp-super-cache有几大突出特点:1、功能强大。
wp-super-cache几乎可以完全静态化所有页面,即时你没有将固定链接修改成伪静态链接,cos-html-cache办不到。
2、可定制性强。
wp-super-cache的面板有多达几十处设置,这可以说优点,也可以说是缺点,cos-html-cache只有两项设置,所以很多朋友不会设置wp-super-cache,使用wp-super-cache速度反而变慢。
在文章下面的部分将会告诉大家如何设置wp-super-cache使得大流量wordpress和小流量均适用。
3、兼容性强,这里有两层含义。
一、随着版本不断更新,wp-super-cache兼容的主机不断增多。
二、随着版本不断更新,wp-super-cache和其他wp插件之间协同工作能力更强大。
甚至有专门针对wp-super-cache的优化插件,如Autoptimize、AskApache Crazy Cache等。
另外wp-super-cache支持简体汉语等十几个语种,兼容性之优越,是其他插件无可比拟的。
4、负责任的作者。
wp-super-cache的作者常驻wordpress官方论坛,对大家的提出的问题及时回答。
论坛/tags/wp-super-cache插件下载/extend/plugins/wp-super-cache/download/灵活使用wp-super-cache教程:1、过期时限 & 废品收集这项设置,很多教程推荐是秒,也就是一天的时间。
对于这项设置要注意的是,如果你网站文章、评论更新不频繁的话,可以设置为0,0默认为不启用状态。
为什么要设置为不启用?因为缓存生成后,时间超过过期时限的话,立即被标记成为废品,下次页面再有访问时将重新生存缓存。
如果你网站更新不频繁,那就没必要设置作废时间,这样可以大大减少网站所在主机CPU负荷。
有朋友会问,这样一个页面是不是会永远不更新?答:不会,当你有新文章发表时、新评论时,亦可自动刷新缓存。
2、Only refresh current page when comments made.这项设置是在最新版本中才有的设置,有些博客评论比较频繁,但是新评论会触发已有缓存过期,如果不希望评论就触发缓存过期的话,可以把这项勾上。
3、Preload Cache这项设置是在最新版本中才有的设置,之前wp-super-cache的工作原理是在一张页面被第一访问时(或过期后第一次被访问)才会生存缓存,这样对搜索引擎如果访问未缓存的页面,速度会比较慢,影响到搜索引擎排行。
有了这个选项后,你可以一次性生成所有静态网页,你也可以设置一个周期,一旦到达这个周期后重新生成多有链接的缓存。
对seo大大有利,不过会占用更多的存储空间。
4、其他设置大部分选项都有良好的汉化,比如Super Cache 压缩、启用 WP Cache 与 Super Cache 这些和以往版本一样,勾上即可。
如果按照以上选项设置,相信你的网站不会慢。
但是如果 WordPress 的首页显示的不是最新日志,而是一个页面,并且这个页面包含实时更新的部分,那么就会存在一个问题,那么这个页面就不会实时更新。
这里我提供一个技巧,可以让你在使用 WP Super Cache 的这个静态缓存插件提速的同时,也能够让首页实时更新,WP Super Cache 是通过 wp_cache_post_edit 这个函数来编辑缓存的,它的参数是日志或者页面的 ID。
所以我们首先获取用于显示首页的页面的 ID,然后在日志更新或者删除的时候,或者有新留言的时候(如果首页没有包含最新留言,这个可不必),刷新首页。
所以大致的代码如下:<?phpadd_action(publish_post, refresh_front_page, 0); //发布或者更新日志时候刷新首页add_action(edit_post, refresh_front_page, 0); //有新留言或者留言被删除的时候刷新首页add_action(delete_post, refresh_front_page, 0); //删除日志时候刷新首页add_action(publish_phone, refresh_front_page, 0); //通过 email 发布日志之后刷新首页 function refresh_front_page(){$front_page_id = get_option(page_on_front); //获取显示首页的页面 IDwp_cache_post_edit($front_page_id); //刷新该页}?>把这段代码复制到主题的 即可。
当然如果你想刷新某个页面,也可以是用 wp_cache_post_edit 这个刷新它,参数是页面的 ID。