首页 > SEO建站 > SEO百科什么是noindex指令?详解noindex的正确使用方法以及对SEO的影响

什么是noindex指令?详解noindex的正确使用方法以及对SEO的影响

2022-03-24 14:57:14

什么是noindex指令

一、什么是noindex指令

noindex是网页Html Meta元素上robots的content的一个值,网络机器人看到Noindex后不会对网页进行索引,搜索引擎上因此不会出现标有noindex的网页,其作用是向搜索引擎声明该网页禁止被索引收录。网页开发者不希望被搜索引擎索引的原因包括网页正在开发、网页所有者希望网页保持私密性等原因。

二、noindex指令的两种正确使用方法:

1、<meta> 标记

若想阻止大部分搜索引擎网页抓取工具将您网站中的某个网页编入索引,请将以下元标记放入该网页的 <head>  部分中:

<meta name="robots"  content="noindex">

表示屏蔽所有蜘蛛爬虫抓取该页面。

meta标记中noindex指令的使用方法

meta标记中noindex指令的使用方法

请注意,某些搜索引擎网页抓取工具对 noindex 指令可能会有不同的解读。因此,您的网页可能仍会出现在其他搜索引擎的结果中。

大量SEOer在使用noindex 指令的时候,经常会采用如下的拓展:

A、content='noindex,follow'

表示:该页面禁止被索引,但页面中的其他的URL,支持爬虫进行抓取与收录。

B、content='noindex,nofollow'

表示:该页面禁止索引,以及页面中所有的URL,都禁止被抓取。

如想阻止某个搜索引擎抓取页面,还可以使用以下方法:

A、<meta name="Baiduspider" content="noindex">

表示要阻止 baidu 网页抓取工具将网页编入索引,请放入以下元标记。

B、<meta name="googlebot"  content="noindex">

表示要阻止 Google 网页抓取工具将网页编入索引,请放入以下元标记。

2、HTTP 响应标头

除了使用元标记,您还可在响应中返回一个值为 noindex 或  none 的 X-Robots-Tag 标头。响应标头可用于非  HTML 资源,例如 PDF、视频文件和图片文件。下面是一个  HTTP 响应示例,它含有一个 X-Robots-Tag,用来指示抓取工具不要将某一网页编入索引:

HTTP/1.1 200 OK

X-Robots-Tag: noindex

HTTP响应标头中noindex指令的使用方法

HTTP响应标头中noindex指令的使用方法

三、什么情况下使用noindex指令

对于Noindex指令,在以下几种情况下页面使用的比较常见:

1、网站的活动促销、信息填报页面,并不需要特定关键词排名

2、网站日常公共页面,如:关于我们、联系我们、会员注册注册页面。

3、提示性质页面,如:404页面错误页面。

4、特定的开源程序插件,比如:WordPress SEO的插件。

四、noindex指令对SEO的影响

反向链接即外链是搜索引擎给网站排名的一个重要因素。为了添加反向链接,SEO作弊者会在论坛和博客等大量发布带无关链接的内容。这些垃圾链接的存在给搜  索引擎对网页质量的评估造成一定程度的麻烦,可以说noindex是一个非常好的"垃圾链接防火墙"。正是百度、谷歌为了应对垃圾链接(Spam)引入的一个属性,此属性应该被广泛采用。

noindex指令对SEO的影响有两方面,一是不给链接投票,增加此链接的权重,二是使添加noindex的部分内容不参与网站排名,便于集中网站权重

五、noindex与nofollow的区别

对于SEO新人而言,经常有SEO人员,容易将两个SEO指令混淆,实际上这里还是有本质的区别的,其中,最核心的区别就是:

1、noindex指令,理论上是严格禁止被搜索引擎收录,展现在搜索结果中的。但是noindex指令必须是搜索引擎抓取网页的时候,才能看到元标记和 HTTP 标头。如果某个网页仍显示在搜索结果中,可能是因为在添加标记后搜索引擎尚未抓取过该网页,这种情况可以使用网址检查工具请求搜索引擎重新抓取您的网页。

2、Nofollow指令,通常主要表述在某个特定页面上的URL,是禁止被百度爬虫抓取的,不传递权重,并不会影响链接所指页面的收录。

关于”nofollow标签”的详细知识请点击。

六、noindex与robts.txt文件

noindex指令,是禁止页面被搜索引擎索引,与在根目录中使用nobots.txt这个文件,禁止某个特定页面抓取是有异曲同工之处的。如果noindex指令在页面时候后未被搜索引擎发现,可使用robots.txt文件阻止搜索引擎抓取该网址,robots.txt文件是搜索蜘蛛抓取页面最先访问的文件,时效性更高。

最后总结

为让 noindex 指令生效,网页或资源不得被 robots.txt 文件屏蔽,并且必须能被抓取工具访问。如果该网页被  robots.txt 文件屏蔽或抓取工具无法访问该网页,那么抓取工具将永远无法看到 noindex指令,因此该网页可能仍会显示在搜索结果中。

想了解更多SEO百科的内容,请访问:SEO百科

本文来源:https://www.youhuaxing.cn/seojianzhan/17346.html

免责声明:部分文章信息来源于网络以及网友投稿,本网站只负责对文章进行整理、排版、编辑,是出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性,不承担任何法律责任。
用我们的专业,做您满意的SEO+高端网站建设服务商!