抵制搜索引擎优化作弊
2022/5/25 16:00:27
有一些作弊技术很容易被发现,例如使用刷新元标记的自动改变加载页面技术。但是使用脚本的自动改变加载页面非常难被发现,因为搜索引擎爬虫不会执行脚本。对于掩饰技术,网络爬虫会把自己伪装成普通浏览器来防止。
使用指向页面的锚文本的词索引页面能够在一定程度上避免内容作弊,因为在其他页面上的锚文本更加可信。这技术本身是为了索引那些不被网络爬虫发现的页面而提出的,现在是搜索引擎中的常用技术,例如:搜索引擎给锚文本中的词更高的权值。实际上,在锚文本周围的词同样提供了对于目标页面的编辑上的判断。
而对于内容作弊,页面描述算法同样有抵制的作用,因为算法本身是基于指向目标页面的链接的,同时指向目标页面的页面需要具有一定知名度或者有一个高排名分数。但是,却没有办法处理前面讨论的链接作弊技术。
相比分别抵制不同类型的作弊,有一种称为信任排名(TrustRank)的技术被提出,能够同时防止所有的作弊技术。这种技术利用知名度网页和非垃圾网页聚集的特点,例如:在网络上,有一定知名度的网页通常很少指向垃圾网页,但垃圾网页通常指向很多有知名度的网页(试图增加自己的中心程度分数)。链接分析方法被用作区分知名度网页和任何形式的垃圾网页,而不是处理单个的作弊技术。
抵制作弊也被认为是一个分类技术,例如:预测一个网页是否是垃圾网页。可以使用指导性的学习算法训练一个垃圾分类器,主要问题在于涉及学习的特点。
1.页面中单词的数目:一个垃圾页面倾向比非垃圾页面包含更多的单词,从而希望能够包含多数流行词。
2.平均单词长度:在英语中平均单词的长度是5个字母,人造内容的平均单词长度通常不同。
3.页面标题中的单词数目:由于搜索引擎通常给页面标题中的单词更多的权值,所以作弊器通常在页面标题中添加更多的关键词。
4.可见内容部分:垃圾页面通常使垃圾项对用户不可见。
但是,有一些作弊技术还是很难被发现,抵制网络作弊是一个不断研究,不断进行的过程,一旦搜索引擎能够探测到一些作弊手段,研究搜索引擎的人就会发明更多的作弊技术。
互联网没有国界的概念。但即使最强大的搜索引擎优化策略,当面对不同的国家、不同的语言、从来没有听说过的搜索引擎时,往往也会败下阵来。
2023/6/12 9:39:49
一些老牌的大型网站并不需要特别的推广工作,但是一些新兴的大型网站就不能这么幸运了。面对一些已经有的大型网站,这些网站的推广工作将会比较困难。
2023/4/10 9:11:35
可以毫不夸张地说,很多网上销售额的损失都是因为产品描述不清楚。如果能够做到最好,那么在网上购物应当比在商店购物更方便,但太多的时候不是这样的,因为商品信息不充分、难于找到或者根本不存在。这会使你怀疑那些机构的目标是为了赚钱还是赔钱。
2023/4/6 9:34:58
想要在自己的博客或者网站上具备更高的吸引力,一种很有效的方式就是发表系列文章。这些文章彼此依赖、互为基础,同时还能给你充分的时间来全面探索某个主题。
2023/4/4 9:48:30
网络营销站点开发成功以后,就可以开始让网站投入正常运行,而网站的日常管理工作也跟随着可以开展了。网站的运作和管理通常包括站点的推广和网站的维护工作。
2023/4/3 9:32:30
企业建立网站的目的不同,那么搜索引擎营销的最终目标也不同。企业网站建立的目的有网络营销、企业宣传、品脾提升等。
2023/3/31 9:53:07