wordpress的robots文件的标准写法

robots文件是seo必须具备的文件,它规定了搜索引擎可以抓取什么内容,不可以抓取什么内容,以及网站地图的位置等重要信息。

首先说些主要屏蔽的栏目的意义;

User-agent: * //设置robots规则适用的浏览者身份为全部UA身份

Disallow: /*?* //屏蔽掉页面中的动态路径

Disallow: /?p=* //屏蔽掉非固定链接的文章页面路径,因为每个页面中都会有一个shortlink使用的是?p= 的路径。

Disallow: /index.php //屏蔽掉首页默认页面的index.php 页面地址

Disallow: /wp-admin //屏蔽掉后台登陆页面地址,主要是考虑到服务器安全

Disallow: /wp-content/plugins //屏蔽掉wordpress的插件目录

Disallow: /wp-content/themes //屏蔽掉wordpress的模板目录

Disallow: /wp-includes //屏蔽掉wordpress的底层程序目录

Disallow: /trackback //屏蔽wordpress的页面回评路径

Disallow: /*/*/trackback //屏蔽wordpress分类目录、文章页面的回评路径

Disallow: /feed //屏蔽wordpress的内容订阅路径

Disallow: /*/*/feed //屏蔽wordpress分类目录、文章页面的订阅路径

Disallow: /comments/feed //屏幕wordpress评论的订阅路径

Disallow: /page/ //屏蔽默认的翻页路径

Disallow: /*/*/page/ //屏蔽分类目录的翻页路径

Disallow: /page/1$ //屏蔽翻页路径中的数字路径

Disallow: /tag/ //屏蔽标签页面

Disallow: /?s=* //屏蔽搜索结果路径,主要是避免搜索结果的缓存被搜索引擎收录

Disallow: /?r=*

Disallow: /*/comment-page-*

Disallow: /*?replytocom*

Disallow: /date/ //屏蔽按日期分类显示的列表页面

Disallow: /author/ //屏蔽作者文章列表页面

Disallow: /category/ //屏蔽以category为起始路径的分类路径,如果您没有使用插件生成不带category前缀的路径时,请不要使用此项规则。

Disallow: /?p=*&preview=true

Disallow: /?page_id=*&preview=true

Disallow: /wp-login.php //屏蔽后台登陆页面

Sitemap: http://www.frontopen.com/sitemap.xml //引导蜘蛛爬取网站地图

下面推荐一个最佳的robots.txt规则:

User-agent: *

Disallow: /wp-admin/

Disallow: /wp-content/

Disallow: /wp-includes/

Disallow: /trackback/

Disallow: /comments/

Disallow: /attachment/

Disallow: /comments/feed

Disallow: /feed

Disallow: /*/feed

Disallow: /*/comment-page-*

Disallow: /*?replytocom=*

Disallow: /*/trackback

Disallow: /?s=*

Disallow: /*/?s=*\

Disallow: /wp-*.php

Sitemap: https://www.nllnw.com/sitemap.xml

原创文章,作者:shusheng,如若转载,请注明出处:https://www.nllnw.com/wp/291.html

(0)
上一篇 2020-02-15
下一篇 2020-02-15

发表回复

登录后才能评论