为Z-Blog建立robots.txt文件

作者:Cloudream2008年1月8日放大缩小

Robots.txt文件用于告知搜索引擎网站哪些目录不可以爬行/收录,其目的在于保护不愿公开的文件,如后台路径、出错页面路径等。也许您会问,我的网站没有robots.txt文件也工作的好好的,还有什么必要建立这个文件呢?

当然有——可以减少您的空间流量,尤其是对于每月仅几十G流量的国内空间来说。通常robots.txt不足1K大小,而无此文件时,服务器向搜索引擎返回的404错误页面通常也会大于此。而robots.txt文件未更新时,服务器仅返回304状态码而不返回文件内容,更是可以节省更多流量。

Robots.txt文件的使用说明,您还可以用过谷歌管理员中心检验Robots.txt文件的实际效果。

针对Z-Blog,我们可以建立如下内容的robots.txt

User-agent: *
Allow: /
Disallow: /ADMIN/
Disallow: /CACHE/
Disallow: /CSS/
Disallow: /DATA/
Disallow: /FUNCTION/
Disallow: /INCLUDE/
Disallow: /LANGUAGE/
Disallow: /XML-RPC/

如果您启用了Sitemaps插件,还可以加入如下一行,注意,Sitemaps文件需要写明包括域名在内的绝对路径。

Sitemap: http://learn.z-blog.net/sitemap.xml

您可以下载博课的Robots.txt文件,上传至您的域名根目录下,如果您的Blog在域名my子目录下,如http://learn.z-blog.net/my/则需将Disallow各行修改为Disallow: /my/FUNCTION/。

您也可以在最后一行加入Sitemaps文件地址,记得将域名修改您自己的地址。

1.Washun

1/8/2008 11:47:01 AM

原来有减少空间流量的作用啊。

2.小一

1/8/2008 7:00:57 PM

第一次看到有从这个角度分析的,呼呼~~减少流量!

3.today

1/9/2008 3:02:42 AM

那么这个是不是会暴露后台地址呢

Cloudream 于 2008-1-12 22:35:36 回复
没有必要把后台地址写进去的……其实后台通过.htaccess限制IP更安全。

4.书呆子

1/10/2008 11:36:11 PM

谢谢站长!博课我会常来

5.杀鸡敬猴

1/11/2008 9:28:06 AM

好好的地方,可以学到好多技巧!

6.jayboke

1/11/2008 3:10:50 PM

就是内容太少了。

样式不错。

7.Zx.MYS

1/15/2008 9:47:00 PM

暴露后台地址?I服了U……

8.艾歆

1/19/2008 5:41:51 PM

模板不错

9.even

1/22/2008 12:17:03 AM

非常好的介绍,学习了!

10.没有毛的乌鸦

1/22/2008 8:00:35 PM

学习了

11.纯音乐

1/26/2008 10:00:40 PM

节约流量?能节约多少呢?仅仅是爬虫路过的流量?
隐藏后台地址?呵呵……真有趣。支持,顶!!!

12.幼峰

1/27/2008 1:07:38 AM

学习学习

13.MoonLab

1/28/2008 12:50:15 AM

从减少流量的角度分析,对robots的新认识啊

14.糖罐里的纸条

2/19/2008 6:05:25 AM

挺好,加油啊,支持你.....支持ZBLOG.....

15.floating

4/10/2008 12:25:12 PM

这样能节约流量?汗下。。。。

16.floating

4/10/2008 12:25:42 PM

看下:http://www.baidu.com/search/robots.html

17.無鳴騎士

4/13/2008 12:22:42 PM

啊~原来还有这个作用啊~才知道啊

发表评论