使用META标签禁止搜索引擎抓取的方法代码
2022/5/25 15:57:17
大多数情况下,我们都会使用robots.txt文件对搜索引擎蜘蛛的抓取行为进行限制,这是一种非常规范的做法。除此之外,我们还可以通过网页头部的META标签禁止搜索引擎抓取,这种方法的优点是只针对当前网页,操作起来比较灵活。
具体的代码非常简单,只需要在你的网页和之间插入一句:
<meta name="robots" content="属性值" />
其中的属性值可以按照要求从下面四选一:
1. CONTENT="INDEX,FOLLOW:可以抓取本页,而且可以顺着本页继续索引别的链接
2. CONTENT="NOINDEX,FOLLOW:不许抓取本页,但是可以顺着本页抓取索引别的链接
3. CONTENT="INDEX,NOFOLLOW:可以抓取本页,但是不许顺着本页抓取索引别的链接
4. CONTENT="NOINDEX,NOFOLLOW:不许抓取本页,也不许顺着本页抓取索引别的链接。
此外,还可以使用此句代码禁止搜索引擎为你的网页建立快照,方法是在属性值里面增加一个noarchive即可,因此,完整的代码示例演示如下:
<meta name="robots" content="NOINDEX,FOLLOW,noarchive" />
意思即禁止所有搜索引擎抓取本页面,但是可以通过本页面的链接去抓取别的页面,同时还禁止为本页面建立网页快照。
如果你只是想禁止某一个搜索引擎,那写非常简单,只需要将代码中的 robots 替换成对应搜索引擎的代号即可,如下:
google蜘蛛: googlebot
百度蜘蛛:baiduspider
yahoo蜘蛛:slurp
alexa蜘蛛:ia_archiver
msn蜘蛛:msnbot
有道蜘蛛:YodaoBot和OutfoxBot
搜狗蜘蛛:sogou spider
SOSO蜘蛛:sosospider
重要性网页是搜索引擎最希望优先收录的,这是每一个搜索引擎收录策略的目标之一。 如何提高网页的重要性,则是SEO的目标之一。
2023/4/23 9:54:39
视频宣传
2023/4/17 9:10:22
索引数据库 (IndexedDB) API(作为 HTML5 的一部分)对创建具有丰富本地存储数据的数据密集型的离线 HTML5 Web 应用程序很有用。同时它还有助于本地缓存数据,使传统在线 Web 应用程序(比如移动 Web 应用程序)能够更快地运行和响应。本文将介绍如何管理 IndexedDB 数据库。
2023/4/11 9:10:23
Dictionary构建快速导航
2022/5/25 15:57:17
安装的是SQL Server 2008评估版,180天的试用期后,MSSQLSERVER服务就无法启动,手动启动就报告17051错误。
2022/5/25 15:57:17
解析2013年10大网页设计趋势
2022/5/25 15:57:17