robots.txt文件与robots meta标签的应用|运营狗

robots.txt文件是搜索引擎蜘蛛来到网站后访问的第一个文件，我们在编写时有很多需要注意的地方，如果不注意语法的正确使用，有些语句可能发挥不了应有的作用，会影响搜索引擎对网站的访问。接下来运营狗分享下robots文件与robots meta标签的应用。

robots文件可以指定sitemap的位置，写法是 sitemap：域名/sitemap.xml，这样就告诉搜索引擎蜘蛛这个地址是网站地图，如果我们有一些隐私文件要屏蔽搜索引擎蜘蛛不让其抓取时，可以在robots.txt中写上路径地址，相反网站中没有要屏蔽的内容时，则不用写明。

示例如下：

User-agent: *

Disallow: /bin/

Sitemap: https://www.krseo.com/sitemap.xml

如果有个页面不想让搜索引擎收录但却已经收录了，我们可以通过robots meta标签来解决。robots.txt文件主要是限制整个站点或者目录的蜘蛛访问，而 robots meta标签则主要是针对某个具体的页面，此标签放在页面中，专门用来告诉搜索引擎蜘蛛如何抓取该页的内容。

robots meta标签的基本写法是：<meta name=”robots” conten=”index,follow”>，这是我们应该学的SEO基础知识，以下是几项需要特别注意的地方：

1、在 robots meta标签中，name=”robots”表示所有的搜索引擎，也可以针对某个具体的搜索引擎，如针对百度可以写为 name=”Baiduspider”。

2、在content部分有4个指令选项，以英文逗号“,”隔开，分别是：index、follow、noindex、nofollow。

index 指令告诉搜索引擎蜘蛛可以抓取该页面。

noindex 指令与index指令相反，表示搜索引擎蜘蛛不可以抓取该页面。

follow 指令表示搜索引擎蜘蛛可以爬行该页面上的链接。

notollow 指令与 follow指令相反，表示搜索引擎蜘蛛不可以爬行该页面上的链接。

综上所述，robots meta标签有以下4种组合：

当robots meta标签的content值为”index,follow”时，表示这个页面可以被抓取，此页面上的链接也可以被继续爬行，标签可以简写成<meta name=”robots” content=”all”>。

当robots meta标签的content值为”noindex,nofollow”时，表示这个页面不可以被抓取，此页面上的链接也不可以被继续爬行，标签可以简写成<meta name=”robots” content=”none”>。

以上是robots.txt文件与robots meta标签用法。当发现网站中某个页面需要屏蔽蜘蛛抓取时，可以在该页面的源代码的<head>和</head>之间添加robots meta标签。

SEO运营课程

最后，如果你想了解一下SEO行业的推广逻辑和推广方法，或者是有计划想通过SEO来进行创业或者进行就业、变现赚钱的你，不妨看看这个专属的SEO配套课程：

SEO推广体系课

特别申明：本站的主旨在于收集互联网运营相关的干货知识，给运营小伙伴提供便利。网站所收集到的公开内容均来自于互联网或用户投稿，并不代表本站认同其观点，也不对网站内容的真实性负责，如有侵权，请联系站长删除，转载请注明出处：robots.txt文件与robots meta标签的应用：https://www.zcly.cn/103495.html。

robots.txt文件与robots meta标签的应用

SEO运营课程

猜你喜欢

发表回复