采集的内容怎么避免处罚

时间:2020-06-18 21:40:19 浏览:

【张亚楠】最近百度推出飓风算法,严厉打击恶劣采集站,很多站点不幸中招,流量一夜回到解放前。我研究了百度和Google的文档,详细定位了算法的命中范围。
给其他网站提供免费的服务,比如免费统计,免费评测,免费天气查询代码,免费博客,免费ip查询代码,免费股票查询代码,免费搜索代码,免费在线客服系统,免费留言本,免费域名,免费空间,免费pr评价,免费电子书,免费查询,免费挂qq,免费认证,免费素材等等。要让自己提供的服务,成为其他网站的标准配置。时间久了,流量自然有了。

采集的内容怎么避免处罚

百度公告
我们先来看下百度官方公告,内容如下:

  • 百度搜索于近日推出飓风算法,旨在严厉打击以恶劣采集为内容主要来源的网站,同时百度搜索将从索引库中彻底清除恶劣采集链接,给优质原创内容提供更多展示机会,促进搜索生态良性发展。
  • 飓风算法会例行产出惩罚数据,同时会根据情况随时调整迭代,体现了百度搜索对恶劣采集的零容忍。优质原创站点如发现站点索引量大幅减少且流量大幅下滑现象,可在反馈中心进行反馈。

飓风算法分析

从官方文档中来看,飓风算法的命中对象是站点,而不是网页;主要是针对以恶劣采集为内容主要来源的网站,而不是所有包含恶劣内容的站点。

哪些内容算是恶劣采集

恶劣采集内容,一般是指没有花费时间,精力,专业能力,人工整合的内容,或者说对用户没有任何附加价值的内容。

这部分内容有以下几种类型:

  • 从其他站点采集的内容。包括整个页面内容都是采集、主题内容是采集,或者多篇采集拼凑成的内容。这种类型内容很容易被识别。
  • 采集之后轻度加工的内容。包括修改了部分词语,修改了部分句子,或者使用单词批量替换的形式(部分伪原创工具)。这种类型的识别难度稍微大一点。
  • 从某些动态站点采集的内容。包括采集其他搜索引擎的搜索结果(火端搜索),采集新闻feed流。

注意几个要点:主体内容、恶劣采集、附加价值。
哪些内容不算是恶劣采集

群里也有朋友问,为什么有些网站也是采集的,但没有受到影响,比如某doc、某浪。其实只要做到某个要点,就不算是恶劣采集,这个要点就是:给用户带来附加价值。

附加价值有站点增益和内容增益两种。这个时候可以引用百度搜索技术博客《浅谈互联网页面价值》的一段内容:

  • 某人发表了一篇针对某新闻事件的原创博客,随后被新浪转载到了新闻频道。从描述的内容上讲,这是一种重复。但这种重复仅仅是主体内容上的重复,一方面它的转载带来了访问速度、稳定性等方面的增益,并且之后的检索用户还有可能用“新闻事件+新浪”来检索此新闻。这可以被称之为站点增益。另一方面,它在转载过程中可能会改变页面的标题,而且依托其受众,在转载页面上,还有可能出现更多的有价值评论和回复等,还有可能存在指向其它相关事件的新闻链接。这些可以被称之为内容增益。因此即使主题内容没有任何变化,新浪的这次转载也是有价值的,其稀缺度也是较高的。
  • 同样,反过来说,如果转载的网站相当不知名,则其无法带来站点名/稳定性/速度的增益。更有甚者,转载之后在页面上加入大量广告妨碍阅读,或者只转载了内容中不完整的一部分,这样的转载,或者说采集,就是纯重复的,与采集源相比,就是没有检索价值的了。 综上所述,对于主体内容重复的页面,我们应该评价其是否存在站点增益和内容增益,只有对于大量完全无增益的重复页面,我们才应该认为其稀缺度较低。

这里的要点是:页面价值、增益

因此说,只要能够带来站点增益,内容增益,给用户带来附加价值,那就表明这个网页有其独特的价值,是不会被飓风算法命中的。

最后

百度的朋友透露,飓风算法主要是针对没有价值的采集,一旦中招没有任何解法。而被误伤的优质原创可以通过反馈中心申诉。如何避免被飓风算法命中。(我下一篇文章会讲。)

百度最近的战略发生了调整,对内容生态的打造成了重中之重。而对恶劣采集内容的打击,也是势在必行。

我预测,对采集的打击,对原创的支持,将是百度搜索内容部分的主旋律,飓风算法也会持续更新。
在做优化的那时候,许多人是集中化做核心关键词优化,那样的优化十分局限性,网站只能被小量的潜在客户见到。因此在更新网站内同时,要把不同类别的关键词都用到,根据行业和公司涉及的业务建立起词库,提升网站的覆盖率。

下一篇将揭秘如何避免被飓风算法命中,敬请期待。

单页面网站只有一个网页。因为吸引目标群体,标题title是相当重要的,而且一定要具备诱惑力,进而增加单页面网站的浏览量。在这儿,特别注意标题、产品词+精准定位词的写作技巧,并在精准定位词中加入核心关键词。不要在标题中堆积关键词,以防遭受处罚。

前言

在百度站长论坛,看到有很多朋友提问,网站中了百度飓风算法,被飓风“吹成太监”,该怎么办好。在上一篇文章分析了飓风算法的命中范围。这次我们来谈谈解决方法。

被飓风算法影响怎么办

针对飓风算法的影响,百度一个朋友透露说:
飓风算法主要是针对没有价值的采集,一旦中招没有任何解法。而被误伤的优质原创可以通过反馈中心申诉。
因此,一旦被飓风算法命中,只要不是明显误伤,短期内都没有办法解决。(被搜素引擎算法命中,一般都是普遍存在的,不被搜素引擎接受的做法,一般没办法申诉,Google也是如此。只有人工处理的能申诉。)

如何避免被飓风算法命中

采集会被算法惩罚,而内容完全原创,成本又非常高。那如何生成内容,而又不被飓风算法惩罚呢。其实还是围绕内容增益上去解决,有几个解决方法:

增加用户点评模块

页面增加用户点评模块,当有用户点评之后,点评内容也会成为网页内容的一部分,产生了额外价值。作为用户,在阅读完内容之后,也希望看一下真实用户的意见,比如这个内容是否属实,信息是否失效,有没有额外的提醒等。
不过要注意的是,点评内容最好是在源码中实现,而不是在JS中(方便搜素引擎识别)。

、做大做强网站推广法。比如门户站。让小网站以加自己网站的链接为荣。尽管很少有站从门户网站得到一星半点的好处,但是对强者天然的崇拜心理,仍然让无数站长不由自主地献身链接,并以此为光荣。至于人家是否留意和领情,则是另外一回事了。
Studies have shown that users have different reading habits in print and on a screen. Instead of reading the content of websites word for word, they scan the text for the relevant information only.
 

 

标签:

本文地址: 采集的内容怎么避免处罚

版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。