seo nofollow

发展编辑
最初,"Nofollow"属性出现在网页级元标记中,用于指示搜索引擎不要追踪(即抓取)网页上的任何出站链接。例如:<meta name="robots" content="nofollow" />。
而后,在将"Nofollow"用于各个链接前,我们需要完成大量的工作(例如,将链接重定向至robots.txt中拦截的网址),以阻止蜘蛛追踪某网页上的各个链接。因此,我们创建了rel属性的"Nofollow"属性值。这可让网站管理员更精确地进行控制:无需指示搜索引擎和漫游器不要追踪该网页的所有链接,只需轻松地指示蜘蛛不要抓取某特定链接即可。例如:<a href="signin.php" rel="nofollow">signin</a>。
原因作用编辑
我们都知道,反向链接即外链是搜索引擎给网站排名的一个重要因素。为了添加反向链接,SEO作弊者会在论坛和博客等大量发布带无关链接的内容。这些垃圾链接的存在给搜索引擎对网页质量的评估造成一定程度的麻烦,可以说nofollow是一个非常好的“垃圾链接防火墙”。正是百度、谷歌、Yahoo、MSN 为了应对垃圾链接(Spam)引入的一个属性,此属性应该被广泛采用。
Nofollow标签的作用有两方面,简单的说,一是不给链接投票,降低此链接的权重,二是使添加nofollow的部分内容不参与网站排名,便于集中网站权重,减少权重的分散。
使用方法编辑
nofollow标签通常有两种使用方法:
1、将"nofollow"写在网页上的meta标签上,用来告诉搜索引擎不要抓取网页上的所有外部和包括内部链接。
<meta name="robots” content="nofollow” />
2、将"nofollow"放在超链接中,告诉搜索引擎不要抓取特定的链接。
<a rel="external nofollow" href="url"><span>内容</span></a>

3、nofollow标签是超链接<a>的一个属性值,我们只需要在源代码里面加上rel=”nofollow” 或者更为正规的rel=”external nofollow”即可 即:<a href=”#” target=”_blank” rel=”nofollow”>###</a> 。
nofollow还有另外的一些写法:
Meta robots标签必须放在和之间,格式:
content中的值决定允许抓取的类型,必须同时包含两个值:
是否允许索引(index)和是否跟踪链接(follow,也可以理解为是否允许沿着网页中的超级链接继续抓取)。
content部分有四个命令:index、noindex、follow、nofollow,命令间以英文的“,”分隔。
INDEX命令:告诉搜索引擎抓取这个页面
FOLLOW命令:告诉搜索引擎可以从这个页面上找到链接,然后继续访问抓取下去。
NOINDEX命令:告诉搜索引擎不允许抓取这个页面
NOFOLLOW命令:告诉搜索引擎不允许从此页找到链接、拒绝其继续访问。
根据以上的命令,我们就有了一下的四种组合
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">:可以抓取本页,而且可以顺着本页继续索引别的链接
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">:不许抓取本页,但是可以顺着本页抓取索引别的链接
<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">:可以抓取本页,但是不许顺着本页抓取索引别的链接
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">:不许抓取本页,也不许顺着本页抓取索引别的链接。
这里需要注意的是,不要把两个对立的反义词写到一起,例如
<META NAME="ROBOTS" CONTENT="INDEX,NOINDEX">
此外对于多命令,这里有一个简便的写法,
如果是 <META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">
的形式的话,可以写成:<META NAME="ROBOTS" CONTENT="ALL">
如果是 <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">
的形式的话,可以写成:<META NAME="ROBOTS" CONTENT="NONE">
如果是对于单独的某个搜索引擎不允许建立快照,例如谷歌,我们就可以写成:
<META NAME="Googlebot" CONTENT="INDEX,FOLLOW,noarchive">
如果在元标记中不屑关于蜘蛛的命令,那么默认的命令即为如下
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW, archive">
因此,如果我们对于这一部分把握不准的话,可以直接写上上面的这一行命令,或者是直接留空。
2.禁止搜索引擎建立快照。
<meta name="robots" content="noarchive">
以上的一段代码限制了所有的搜索引擎建立你的网页快照。如果我们需要仅仅限制一个搜索引擎建立快照的话,就可以像如下这样去写
<meta name="Googlebot" content="noarchive">
这样的标记是禁止搜索引擎为你的网站建立快照。
使用示例编辑
如某博客上有垃圾评论:
<a href="URL">顶顶</a>
以下操作,即进行了 nofollow:
<a href="URL" rel="nofollow" >灌水</a>
在网页的 <HEAD> 部分添加适当的 <META> 标签。
拦截所有搜索引擎把网页收录:
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
只是拦截百度蜘蛛爬取网页,而允许其他搜索引擎收录:
<META NAME="baiduspider" CONTENT="NOINDEX, NOFOLLOW">
允许搜索引擎收录你的网页,但禁止其追踪外部链接:
<META NAME="ROBOTS" CONTENT="NOFOLLOW">
允许搜索引擎收录你的网页,但禁止其收录网页上的图片:
<META NAME="ROBOTS" CONTENT="NOIMAGEINDEX">

huan

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: