您好,欢迎访问本站博客!登录后台 用户注册
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏吧
  • 如果您需要网站优化、微信开发、网站建设、网络推广、网络营销等需求请 点击联系QQ 向博主王小宁说明您的具体需求。

搜索引擎反作弊算法

百度算法 ml2016 2015-07-08 3712 次浏览 0个评论
0

自从有搜索引擎以来,就有人不断研究搜索引擎的排名机制,进而寻找搜索引擎排名的技术和逻辑漏洞,来快速提升自己网站的搜索排名,并且获得流量和收益。也就是说自从有搜索引擎以来,作弊就没有停止过。为了保证呈献给用户的搜索结果质量,发掘真正内容优质、用户体验最佳的网页,反作弊一直都是搜索引擎研究的重要课题,但是搜索引擎一直处于被动应对地位,经常是发现搜索结果被作弊网页攻陷了,才去研究相应的反作弊对策和算法。那么搜索引擎在反作弊的过程中主要是如何操作的呢?真的会像外界猜测的那样有那么多的人工干预吗?
反作弊算法在搜索引擎的架构中过滤也是很重要的一环,在Spider抓取部分会过滤掉重复和垃圾页面,在进行排序和呈现时同样还会进行一次过滤,来保证搜索结果的质量。反作弊就是过滤环节中的主要组成部分。当下搜索引擎排名的重要参考因素主要有内容、链接、网站权重和用户体验,所以作弊也一般是从这几方面入手。第12章会详细讨论一下常见的作弊手法,这里主要来讨论一下搜索引擎是如何进行反作弊的,反作弊过程中是否会出现误伤,以及站长和SEO人员应该如何避免被搜索引擎误伤。
虽然搜索引擎针对每种作弊行为所做的反作弊动作和算法各不相同,但是大体上还是有一定规律可循的。搜索引擎会利用黑白名单和作弊特征研究两方面进行反作弊算法升级。
黑白名单
搜索引擎会根据网站内容的质量、权重、品牌建立白名单,也会找出明显作弊严重的网站建立黑名单。搜索引擎会认为白名单中网站所推荐的网站都是好的、健康的网站,含有黑名单中网站链接的网站可能会存在某种问题。
如图2-24所示,链向白名单中网站的网站不一定是健康的,同时黑名单中网站链向的网站也不一定是不健康的。但是有多个白名单网站链向同一个网站,那么这个网站就很可能是健康的。同一个网站链向了多个黑名单中的网站,就可以把其认定为不健康的网站。

2.JPG 搜索引擎反作弊算法 百度算法

图 2-24 黑白名单示意图


本文标题:搜索引擎反作弊算法
本文链接:http://web.geek400.xyz/post/148.html
作者授权:除特别说明外,本文由 小宁 原创编译并授权 小宁网络安全技术团队 刊载发布。
版权声明:本文不使用任何协议授权,您可以任何形式自由转载或使用。

已有 3712 位网友参与,快来吐槽:

发表评论

验证码

召唤伊斯特瓦尔
站点统计