采集行为是从百度诞生以来就存在的非法操作,采集者自己不生产内容,主要搬运他人的劳动成果,是非常恶略的作弊手段。

飓风算法经历了3个版本迭代:

飓风算法1.0

2017年7月4日,百度搜索资源平台发布公告推出飓风算法,旨在严厉打击以恶劣采集为内容主要来源的网站,同时百度搜索将从索引库中彻底清除恶劣采集链接,给优质原创内容提供更多展示机会,促进搜索生态良性发展。

飓风算法会例行产出惩罚数据,同时会根据情况随时调整迭代,体现了百度搜索对恶劣采集的零容忍。优质原创站点如发现站点索引量大幅减少且流量大幅下滑现象,可在百度搜索资源平台的反馈中心进行反馈

飓风算法2.0

2018年9月13日,百度对飓风算法进行升级,发布飓风算法2.0,主要打击采集痕迹明显、内容拼接、站点存在大量采集内容、跨领域采集等五类采集行为。飓风算法2.0旨在保障搜索用户的浏览体验,保护搜索生态的健康发展、对于违规网站,百度搜索会依据问题的恶劣程度有相应的限制搜索展现的处理。

飓风算法3.0

2019年8月8日,百度搜索将飓风算法升级到飓风算法3.0,主要打击百度搜索下的PC站点、H5站点、智能小程序存在的跨领域采集及批量构造站群获取搜索流量的行为。飓风算法3.0旨在维护健康的移动生态,保障用户体验,保证优质站点/智能小程序能够获得合理的流量分发。

飓风算法3.0官方公告原文:

为了维护健康的移动生态,保障用户体验,保证优质站点/智能小程序能够获得合理的流量分发,百度搜索将在近期对飓风算法进行升级,上线飓风算法3.0。

本次算法升级主要针对跨领域采集以及站群问题,将覆盖百度搜索下的PC站点、H5站点、智能小程序等内容。对于算法覆盖的站点/智能小程序,将会根据违规问题的恶劣程度,酌情限制搜索结果的展现。

以下详细说明飓风算法3.0的相关规则。

一. 跨领域采集:

指站点/智能小程序为了获取更多流量,发布不属于站点/智能小程序领域范围的内容,通常这些内容采集自互联网,内容质量及相关性低、对搜索用户价值低。对于这样的行为搜索会判定该站点/智能小程序的领域专注度不足,会有不同程度的限制展现。

跨领域采集主要包括下面两类问题:

第一类:主站或主页的内容/标题/关键词/摘要等信息显示该站有明确的领域或行业,但发布内容与该领域不相关,或相关性较低。 
问题示例:美食类智能小程序发布足球相关内容 

第二类:站点/智能小程序没有明确的领域或行业,内容涉及多个领域或行业,领域模糊、领域专注度低。 
问题示例:智能小程序内容涉及多个领域

二. 站群问题:

指批量构造多个站点/智能小程序,获取搜索流量的行为。站群中的站点/智能小程序大多质量低、资源稀缺性低、内容相似度高、甚至复用相同模板,难以满足搜索用户的需求。

问题示例:多个智能小程序复用同一模板,内容重复度高、内容少且内容稀缺性低


以上就是飓风算法3.0的相关说明,算法预计在8月内陆续上线。请大家及时查收站内信、短信等渠道的提醒,积极自查完成整改,避免不必要的损失。