文章分类 | 推荐文章 | 最新文章 | 热点文章 | 最新软件 | 精品软件 | 下载排行 | 推荐下载 | 免费看大片 | WPS | 杀毒软件
清风网络
首 页 软件下载 网络学院 数码学院
QQ 电脑入门 游戏 操作系统 图形处理 办公软件 媒体动画 精文荟萃 工具软件 网络编程 程序开发 网络技术 认证考试 网站建设 文章专栏
当前位置:清风网络学院网站建设搜索引擎控制搜索引擎访问和索引你的网站
精品推荐
特别推荐
·网站诊断案例:分析网站需要逻辑思维
·SEO软件也不能成为SEO的唯一分析工具
·搜索引擎营销(SEM)对企业很重要
·网站图片进行搜索引擎优化研究
·浅谈搜索引擎技术的难点及工作原理
·关于新网站的搜索引擎优化草案
·多个网站关键词该如何优化?
·汇总直接影响网站排名的主要因素
·搜索引擎上获得好排名的十个技巧
·影响网站排名的六大因素
·关于Google Adsense PIN的一些处理方式
·影响网站搜索引擎排名的17条隐患因素
·登陆页优化的七大规则
·网站链接质量的判断方法
·胡宪东谈搜索优化的实战
·你的网站是否会被搜索引擎封杀?
·企业网站网站要弄清楚为什么要做网站优化?
·国外WEB标准推广站点
·如何用Google搜索任意时间内更新的网页
·搜索优化:传统的网站结构面临挑战?
热点TOP10
·“x365x”“纯爱社区”关键词及搜索引擎作风
·什么是人肉搜索引擎
·关于新网站的搜索引擎优化草案
·超酷的新浪新闻频道的图片切换特效提供代码
·搜索引擎有效删除有害网页内容的探究
·让搜索关键字高亮显示,一目了然
·腾讯招三千“人肉搜索”军团
·世界各大搜索引擎的蜘蛛名称列表
·Baidu、Yahoo和google搜索引擎的搜索高级语法及应用
·互联网搜索大赛赛题讲解(十三)
·繁体版搜索引擎的使用
·第三代搜索引擎搜狗(Sogou)的十大特征
·面向搜索引擎的内容管理系统(CMS)设计
·桌面搜索方便文件查找数据恢复
·巧用歌词在“一搜”中搜索MP3
·行业网站运作与赢利模式分析
·国外著名搜索引擎ZEAL网站登陆经验谈
·全球各大搜索引擎总汇
·制作刻录系统自动还原光碟
·网站诊断案例:分析网站需要逻辑思维

控制搜索引擎访问和索引你的网站

日期:2007年9月12日 作者: 查看:[大字体 中字体 小字体]


原文:Controlling how search engines access and index your website
发表于: 2007 年 1 月 26 日 上午 11:36:00

我经常被问到 Google(谷歌)和搜索引擎是怎样运转的。一个核心问题是:谷歌是怎样知道一个网站的哪些部分是网站所有者想让它们显示在搜索结果中?网站内容发布者能够指定部分网站不被搜索吗?好消息是,网站内容发布者可以使用很多方法控制你们的网页在搜索结果中的显示。

文件 robots.txt 是这里的主角,该文件已经成为业界标准好多年了。它让一个网站所有者控制搜索引擎访问他们的网站。你可以用 robots.txt 不同层次地控制访问,比如让搜索引擎只访问整个网站,单个目录,特定类型的网页,或者某一网页。有效地使用 robots.txt 能让你更好地控制对你的网站 的搜索,但是如何达到这一目标不是很显而易见的。这是我们关于如何使用 robots.txt 来控制对你的网站的存取的一系列帖子的第一篇。

文件 robots.txt 有什么用?

互联网真的很大。你只是不相信它是怎样地无穷无尽地大。你也许认为维护网站耗费好多精力,但是那只是“网海一粟”。 (对 Douglas Adams 致以诚挚的道歉)

象谷歌这样的搜索引擎会读取所有信息并对这些信息索引,索引是为了让一个搜索引擎对一些用户查询显示与之相匹配的网页。

为了做到这一点谷歌的一些电脑不断抓取网站,他们有一个谷歌所知道的所有网站的名单,他们阅读每个网站的所有网页。所有这些机器被称为谣 Googlebot。一般来说,你是愿意让 Googlebot 访问你的网站,这样你的网页才可以被人们在谷歌搜到。

然而,对你的网站上的某几页,你可能不想让谷歌索引。举例来说,你可能有一个目录包含内部日志,或者你可能有些新闻文章只能在支付费用后才能访问。你可以通过创建一个文本文件名为 robots.txt 的文件并把它放置在根目录下来告诉谷歌爬虫不要去抓取他们。文件 robots.txt 包含了一个搜索引擎不能访问的页面的清单。创建一个 robots.txt 是直截了当的,它允许你用一套精密分层控制搜索引擎对你网站的访问。

精细控制

除了 robots.txt 文件让您为你的一大堆文件简洁明了给出指令外,你也可以利用 robots META 标签来精确控制对你的单个网页的访问。为了做到这一点,你只需要对你的 HTML 网页添加特定的 META 标签来控制怎样对单个网页索引。归而总之,robots.txt 和 META 标签让你更灵活地表达复杂的访问规定变得比较容易。

一个简单的例子

这里是一个简单的例子,它是一个 robots.txt 文件。

User-Agent: Googlebot
Disallow: /logs/

User -Agent 行指明下面部分的一套指令只是为 Googlebot。所有主要搜索引擎都阅读并听从你放在 robots.txt 的指令。只要你愿意,你可以为不同的搜索引擎指定不同的规则。Disallow 行告诉 Googlebot 不能进入你网站的档案日志子目录。你放在日志目录中的内容将不会显示在谷歌搜索 结果中。

禁止访问单个文件

如果你有一篇只有注册用户才能访问的文章,你一定想让它排除在谷歌的结果之外。为了做到这一点,你只需要在该文章对应的 HTML 文件中添加一个 META 标签。该文件的代码的最开始有点像:

<html>
<head>
<meta name="googlebot" content="noindex">
...

这段代码会阻止谷歌索引此文件。标签 META 特别有用,如果你只被允许编辑单个文件,而不是全站的 robots.txt。他们还允许你逐页地指定复杂的访问控制规定。

了解更多

你可以在 http://www.robotstxt.org/谷歌的站长帮助中心找到更多有关 robots.txt 的更多有用信息,包括:

如何构造一个 robots.txt 文件
对谷歌使用的每个 User-agent 的描述
如何使用模式匹配

[1] [2] 下一页 




上一篇:站长访谈:访中国最大Web开发社群站长—蓝色

下一篇:距离北京2008年奥运会开幕的倒记时特效

控制搜索引擎访问和索引你的网站 相关文章:
·“黑客”教你如何远程控制计算机
·28个免费在线电影网站
·几秒钟让你的电脑百毒不侵,提速百倍!
·中国十大免费电影网站排行
·震撼你的视觉 3D星空高清晰壁纸欣赏
·如何建立一个网站?规划、设计、目的、原则、宣传
·网络玄幻小说十大网站
·台湾500大网站排行榜
·色情视频网站“女主持”网上脱衣表演被逮捕
·外挂 录象 网站 举报方案最新教程_QQ堂
控制搜索引擎访问和索引你的网站 相关软件:
·自己动手建立企业网站
·用Photoshop美化你的相片
·自己动手建设个人网站
·闪魂——Flash网站建设实录
·公司企业网站管理系统模板功能强大版
·各大MP3搜索网站前十名下载曲目
·唤醒你的创业精神
·30天改变你的人生
·爆出网站数据库路径
·400套超酷网站模板

特别声明:本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作者。文章版权归文章原始作者所有。对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转载的文章有版权问题请联系编辑人员,我们尽快予以更正。
[打印本页] [关闭窗口] 转载请注明来源:http://www.viphot.com
| 帮助(?) | 版权声明 | 友情连接 | 关于我们 | 信息发布
Copyright 2007 www.viphot.com All Rights Reserved. 鄂ICP备05000083号Powered by:viphot