热门关键字:  博客  博客入门  博客创建  新浪博客  css
当前位置 :| 首页>博客知识>SEO博客>

看我是怎么用WordPress消灭“补充材料”的

来源: 作者: 时间:2008-02-20 点击:
我这个博客,你在Google里面输入:
site:sheawey.com *** -hhh
可以看到,几乎没有补充材料,我是怎么做到的呢?
(1)我这个博客3月底刚开始写的时候,由于外部链接的缺少,随着文章的增多,只要那篇文章不在首页有链接,就会直接进入“补充材料”,因此我在首页上“最新文章”选择了显示80篇文章,如下图:

具体操作手法是在模板的sidebar.php文件里面坐如下修改:

这样,很快那些文章就逃出了“补充材料”,其实道理很好理解,每个文章页在站点内获得了与首页一样多的链接,自然,不会因为链接的缺少而进入“补充材料”。
这个方法在网站刚开始,外部连接缺少的时候可以使用。随着文章的增多就有点影响站点形象了。
(2)多重的归档
这里所说的“归档”主要是指分类、月份归档、作者归档、网站地图、tag、相关文章之类的,因为这些“归档”是完全可以取得跟“首页”一样多的内部链接的,然后文章的链接由这些归档页传递,当然,“归档”种类越多,文章获得的链接就越多,(每文章平均获得的链接数/主页获得的链接数)这个百分比就越大。
这个话题要说起来太广泛了,你可以在实践中慢慢掌握,上面说到的一个内部链接的“数量概念”,还要注意一个“质量概念”,就是尽量在“归档”的时候考虑主题聚合的问题。
(3)分页问题
“归档”的时候,如果某个”归档”页内容比较多的时候,必然涉及到分页的问题。WordPress默认的分页是“上一页、下一页”这样的形式,这是一种链接的单项传递,链接结构是很差的,有人通过“[1][2][3]…[n]”这样的分页形式,这样从链接结构上是比“上一页、下一页”的形式要好。我们随便找两个博客看一下就知道了:
http://www.dunsh.org/ http://www.chinamyhosting.com/seoblog/ (“上一页、下一页”的形式)
http://www.kankanblog.com/ (“[1][2][3]…[n]”的形式)
可以看到,“上一页、下一页”的形式对于首页pr是4或者5他只能传递到2层,而“[1][2][3]…[n]”的形式却能传递到很多层,但一般不会超过10层。
我比较这两种分页导航形式,并不是要采用第二种,事实上,我一种也不采用。MT是seo做得比较好的博客系统,你去看一下他的结构,会发现:居然没有分页,不管首页还是“归档页”。
不过回过头来想想,确实也是,每个分页都是一样的title、meta属性,对于博客来说,是没必要分页的,所以我比较欣赏MT的做法。而在WordPress的博客中,形成Google“补充材料”的很大一部分是“分页”,但是Wordpress没办法后台设置或者模板修改让它不分页,这需要改动程序代码,方法如下:
打开wp-includes/query.php,找到
995行
if
(
empty($q['nopaging']) && !$this->is_singular)
{


把它改为
if
(
empty($q['nopaging']) && !$this->is_singular && !$this->is_archive)
{


看一下,除了首页外,“归档页”全部不分页了。
至于首页的分页,你可以学MT把它从模板中去除,也可以直接在robots.txt中禁止抓取。
(4)文章长度问题
我的观察是每篇文章至少写个150字以上,当然,还跟你网页的“信噪比”有关。
关于长度问题、网页的“信噪比”可以参考我写的这两篇文章:
文章内容过短也可能形成Google的“补充材料”?
“补充材料”实验总结
(5)使用robots文件
某些实在不是很重要,如trackback、siteadmin之类的,找一下补充材料里面是否有不必要的网页,直接用robots禁止即可。
有些人认为feed会跟首页之间形成“复制网页”,因为他跟首页内容几乎类似,事实上没那么回事,在robots文件里面禁止了feed文件是个很麻烦的事情,rss类搜索引擎如feedburner之类的将不会索引你了,所以feed是不能禁止的。
(6)关于“转载”
据我一个月的观察,“转载”跟“补充材料”一点关系也没有,我的两个试验(看右边的sidebar放的页面链接):
简明 Python 中文教程 和 上海“希捷拓展”特色年会。
前者是从网上下载的电子书,直接ftp到网上,50%的页面逃出了“补充材料”,在我看来还是链接结构的问题,因为我是百分百“抄袭”,一点也没改。
后者是我替一朋友做的newsletter,他的这张网页被google索引了快半年了,我把一模一样的挂上去,照样没有被列入“补充材料”。
两个试验,一个是网上大量传播的电子书,一个是就跟一张网页“竞争”,都没事!
(说明:这个实验结束后,这些网页已经被我disallow了。)
总结
所以“补充材料”就是一个链接结构的问题,外部链接和内部链接结构的问题。我通过拿WordPress作为试验程序,描述了大体过程以及一些要领,主要启发思路,不可能面面俱到,比如url规范问题之类的就没说。
老实说,要把“补充材料”彻底消灭,是一种很“洁癖”的做法,一定量的补充材料存在是合理的,如果一个网站的内容结构如果不是实在太简单的话,有点“补充材料”看上去比较“健康”,只要不是绝大多数网页为“补充材料”,大可不必担心。这种“洁癖”玩法更多的是锻炼seo的基本功罢了。
作者:sheawey 发表于:2007-06-15 06:04 最后修改时间: 2007-06-15 06:20
版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本版权声明
看我是怎么用WordPress消灭“补充材料”的

最新评论共有 0 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
用户名: 密码:
匿名?
注册