说到robots.txt大家已经都不会陌生了,但是有些时候很多的细节却还是没有被大多数人注意,比如子凡就忽略了一个细节,导致最近的一些文章在搜索引擎结果中出现了重复而没有意义的链接,如果你也是使用的WordPress,不妨你也看看你自己的robots.txt文件。
如果你的WordPress站点还没有robots.txt文件,那么子凡觉得你就更有必要添加一个了,即使你的站点可以让搜索引擎随意抓取,因为搜索引擎机器人访问网站时,首先会寻找站点根目录有没有 robots.txt文件,如果有这个文件就根据文件的内容确定收录范围,如果没有就按默认访问以及收录所有页面。另外,当搜索蜘蛛发现不存在robots.txt文件时,会产生一个404错误日志在服务器上,从而增加服务器的负担,因此为站点添加一个robots.txt文件还是很重要的。
好了,还是来分享一个经过子凡整理的比较完善的适用于WordPress的robots.txt文件内容吧!
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
User-agent: * Disallow: /wp-admin/ Disallow: /wp-content/ Disallow: /wp-includes/ Disallow: /trackback/ Disallow: /comments/ Disallow: /attachment/ Disallow: /comments/feed Disallow: /feed Disallow: /*/feed Disallow: /*/comment-page-* Disallow: /*?replytocom=* Disallow: /*/trackback Disallow: /?s=* Disallow: /*/?s=*\\ Disallow: /wp-*.php Sitemap: http://yourdomain.com/sitemap.html |
使用方法:新建一个名称为robots.txt文本文件,将以上的内容放进去,然后上传到网站根目录即可。
最后还是简单的解析一下其对应作用
1、User-agent: *
允许所有搜索引擎抓取网站,除非你网站有特别针对某个或多个搜索引擎,你可以适当的设置其抓取。如下只允许百度和谷歌抓取:
1 2 3 4 |
User-agent: Baiduspider Disallow: / User-agent: Googlebot Disallow: / |
这样设置的意思为只允许百度和谷歌的蜘蛛抓取所有,但是这里子凡用的是Disallow并设置的/根目录,所以这里其实是禁止了百度和谷歌抓取,如果要允许所有可以使用Allow,大家可以举一反三的使用,仔细的体会感受一下。
2、Disallow: /wp-admin/、Disallow: /wp-content/和Disallow: /wp-includes/
用于告诉搜索引擎不要抓取后台程序文件页面。
3、Disallow: /*/comment-page-*和Disallow: /*?replytocom=*
禁止搜索引擎抓取评论分页等相关链接。
4、Disallow: /category/*/page/和Disallow: /tag/*/page/
禁止搜索引擎抓取收录分类和标签的分页。(这一条子凡并未添加到上面演示,因为不同WordPress站点可能会有所不同,大家可以根据需要添加)
5、Disallow: /*/trackback和Disallow: /trackback/
禁止搜索引擎抓取收录trackback等垃圾信息
6、Disallow: /feed、Disallow: /*/feed和Disallow: /comments/feed
禁止搜索引擎抓取收录feed链接,feed只用于订阅本站,与搜索引擎无关。
7、Disallow: /?s=*和Disallow: /*/?s=*\\
禁止搜索引擎抓取站内搜索结果
8、Disallow: /attachment/
禁止搜索引擎抓取附件页面,比如毫无意义的图片附件页面。
9、Disallow: /wp-*.php
禁止搜索引擎抓取WordPress网站根目录的以wp开头的文件。
10、Sitemap: http://yourdomain.com/sitemap.html
这个就是为了方便搜索引擎利用的网站地图,具体的根据自己网站需要添加。
其实关于网站robots.txt的内容还有很多很多,这里子凡就只是列举了WordPress最常用的一些规则罢了,如果不是最近因为泪雪博客的robots.txt出现一些马虎导致了问题,子凡也不会单独在整理关于WordPress的robots.txt了,不管怎么样,希望能帮助到大家!
1、本站提供的源码不保证资源的完整性以及安全性,不附带任何技术服务!
2、本站提供的模板、软件工具等其他资源,均不包含技术服务,请大家谅解!
3、本站提供的资源仅供下载者参考学习,请勿用于任何商业用途,请24小时内删除!
4、如需商用,请购买正版,由于未及时购买正版发生的侵权行为,与本站无关。
5、本站部分资源存放于百度网盘或其他网盘中,请提前注册好百度网盘账号,下载安装百度网盘客户端或其他网盘客户端进行下载;
6、本站部分资源文件是经压缩后的,请下载后安装解压软件,推荐使用WinRAR和7-Zip解压软件。
7、如果本站提供的资源侵犯到了您的权益,请邮件联系: 11210980@qq.com 进行处理!
本文地址:https://www.zycang.com/25906.html
文章转载或复制请以超链接形式并注明来源出处。 本文最后更新于:2022-07-27 23:12:48
声明:某些文章或资源具有时效性,若有 错误 或 所需下载资源 已失效,请联系客服QQ:11210980
请登录后发表评论
注册