NEWS
1、robots基本概念
Robots.txt文件是网站的一个文件,它是给搜索引擎蜘蛛看的。搜索引擎蜘蛛爬行道我们的网站首先就是抓取这个文件,根据里面的内容来决定对网站文件访问的范围。它能够保护我们的一些文件不暴露在搜索引擎之下,从而有效的控制蜘蛛的爬取路径,为我们站长做好seo创造必要的条件。尤其是我们的网站刚刚创建,有些内容还不完善,暂时还不想被搜索引擎收录时。
robots.txt也可用在某一目录中。对这一目录下的文件进行搜索范围设定。
几点注意:
网站必须要有一个robot.txt文件。
文件名是小写字母。
当需要完全屏蔽文件时,需要配合meta的robots属性。
2、robots.txt的基本语法
内容项的基本格式:键: 值对。
1) User-Agent键
后面的内容对应的是各个具体的搜索引擎爬行器的名称。如百度是Baiduspider,谷歌是Googlebot。
一般我们这样写:
User-Agent: *
表示允许所有搜索引擎蜘蛛来爬行抓取。如果只想让某一个搜索引擎蜘蛛来爬行,在后面列出名字即可。如果是多个,则重复写。
注意:User-Agent:后面要有一个空格。
在robots.txt中,键后面加:号,后面必有一个空格,和值相区分开。
2)Disallow键
该键用来说明不允许搜索引擎蜘蛛抓取的URL路径。
例如:Disallow: /index.php 禁止网站index.php文件
Allow键
该键说明允许搜索引擎蜘蛛爬行的URL路径
例如:Allow: /index.php 允许网站的index.php
通配符*
代表任意多个字符
例如:Disallow: /*.jpg 网站所有的jpg文件被禁止了。
结束符$
表示以前面字符结束的url。
例如:Disallow: /?$ 网站所有以?结尾的文件被禁止。
东莞网站设计制作,专业做网站公司【三行网络】专注于东莞工厂企业、贸易公司网站建设、独立站官网定制开发—— “匠心精琢、凝聚经典”是三行网络公司的设计理念,以技术为笔,以实力为墨—— 为工厂企业设计制作外贸官网,书写贸易新篇章!专注产品展示型网站开发——产品视图 | ✔ 沉浸式图文介绍 | ✔产品优势精准传递、实景展厅搬上网,硬核实力看得见!
![]()
匠心打造精品,用心成就经典!携手客户共创双赢!
© Copyright 广州三行网络科技有限公司
粤ICP备案号:09210325
东莞做网站步骤第一步:申请域名!
做网站的步骤,和做宣传册的性质差不多,宣传册是由封面、封底、内容页设计、制作而成,而网站是由主页、频道页、内容页做成。只是做宣传册设计好之后,拿到印刷厂、街上的广告公司印刷而成。而网站制作、设计之后,申请域名、购买空间,发布到指定的ip上去。做网站和做宣传册的步骤、流程差不多。下面关于做网站的步骤,我从零开始做网站为您一一介绍: 第一步骤:申请域名 1.了解域名:域名是网站的门牌号码、办公地址。如...
Date: 2026.2.3 阅读详情东莞做网站: 公司官网网页页脚的优化细节
东莞做网站公司,东莞做网站——如何做好网页页脚的优化 网页页脚是一个我们经常不重视的地方,它被遗忘,也可能被使用过度,本文我们将讨论一下网站底部(或者叫页脚)的一些注意点。 大量链接 你肯定见过很多这样的网站:底部有50,100,甚至更多的链接。搜索引擎抓取你的网站时,它会尝试区别网站的不同区域并区别它们的权重。所以你在网站底部放那么一大堆链接,不会对你有什么帮助。我的建议是:让你...
Date: 2026.2.3 阅读详情东莞做网站公司话你知:做网站选择什么样的服务器好?
东莞做网站公司,做网站选择什么样的服务器好?服务器托管须知 现在可以选择放站的服务器种类繁多,有虚拟主机,服务器合租,整台服务器。到底什么样的网站适合于什么样的服务器种类呢?定好服务器后又要选择什么样的机房进行托管呢?现在机房大致分为三类,电信机房,网通机房,铁通机房,当然联系到你的也有可能是这些机房的代理商。 做网站选择什么样的服务器好?服务器托管须知 东莞网站制作http://www.3go...
Date: 2026.2.3 阅读详情