谷歌吞噬了这家网站意味着什么

来源:当代财经网时间:2017-04-19 16:55:51

Google 搜索结果里的 Featured Snippets 小卡片直接显示答案,用户就比较不用从搜索结果里点击链接了,这也导致很多依赖搜索引擎引流的网站的访问量大幅度下降

诞生于2008年的CelebrityNetWorth.com之所以出现,是因为学金融的Brian Warner在一家数字媒体公司工作时很好奇Larry David值多少钱。

“说实话,我想知道Larry David到底有多少钱。我想《抑制热情》刚刚回归,于是我想‘上帝,他一定从《宋飞正传》赚了很多的钱。’我去Google查了类似‘Larry David净值’这样的东西,结果出来的都是垃圾。”

按照CelebrityNetWorth.com的说法,Larry David现在的身价是4亿美元。Warner承认这不是确切的数字,但这个数字不是他和自己的员工随便乱想出来的。他们翻看了房地产交易、数额较大的购买和薪水支付,有时候甚至还跟名人或者名人的代表联系求证。弗洛伊德·梅威瑟的身价Warner估计是被Google最多的,这位以花钱大手大脚著称的拳王甚至给网站传了自己资产账户的截图。

不过Warner警告说:“我不建议你把我们的这些数字用到诉讼案上面去。但我绝对可以打包票的是,在名人身价方面任何时候我们的资料都是你在互联网上能找到的、最准确的信息。”

名人身价多少这个问题火了,火到2012年Warner可以连原来的工作都不要全身心投入到这个网站上。他说网站最高峰的时候一度拥有12名员工。

然后Google插了一脚进来。

大部分时候Google的表现都是像图书管理员一样。你提出问题,它引导你去到web上有可能找到答案的地方。

Google是如何吞噬了这家网站的?

在接受“Google会不会犯错”这个问题查询时Google的直接回答

但是过去5年的时间里,Google一直在进行当圣人的实验。输入问题,然后你可能会在搜索结果页面顶部看到一个方框,里面用加粗体标注了相关问题的答案。复活节是什么时候?谁赢得了《美国好声音》?狗可以吃寿司吗?

Google是如何吞噬了这家网站的?

搜索“狗可以吃寿司吗”返回的Featured Snippet(精选摘要)片段,截图时间是2017年4月17日

这些回答当中有一些包括了源自Google编撰的Knowledge Graph(知识图谱)数据库的信息。大部分数值型和日期型的问题答案都出自这里,此外有些答案是从Google所信任的维基百科抽取出来的。

但有些回答是没有办法人工编撰的,而是利用算法从网上抽取出来的。这些叫做“Featured Snippets(精选摘要)”,在过去已经给Google惹来了麻烦,因为该搜索引擎无意间突出显示了一些带有种族主义、性别歧视或者明显错误的回答。

最终目标是增强用户进行Google搜索的体验……

2014年,Warner收到了一封Google的邮件,询问他是否对免费让该公司访问他的数据来给知识图谱取材感兴趣。

以下是这封邮件的片段:

我们收到了大量有关名人身价方面的搜索查询。有人让我找一个权威的来源,现在我正在研究Net Worth of Celebrities数据集的信息源。最终目标是增强用户进行Google搜索的体验……我正在评估你的网站,你的收集看起来似乎挺全面的……如果你能共享一小部分数据集,也就是大概10位名人的元数据到电子表格里面的话,将有助于我和我的团队评估,看看是否符合我们的条件。

如果同意的话,这将意味着对名人身价的任何Google搜索都将返回抽取出来的答案。答案将包括到Warner网站的链接,Google向他许诺说此举将有助于网站打响品牌。但这也会急剧削减他的流量。大多数人只是想知道数字,对于这些数字是怎么得出的并不在意。所以Warner拒绝了。

他说:“我不知道这对我们有什么好处。我要给它打上一个大大的问号,就好像说‘嘿,让我们挖走你手上最值钱的东西,那些你花了好几年数百万美元才搞到的东西,然后免费给我们好显示出来。’所以最后我们回应说‘我们对这种做法感到不舒服。’”

“但随后他们更进一步把数据取走了。”

Warner说,2016年2月,Google开始展示CelebrityNetWorth数据库中25000位名人的精选摘要。他之所以知道是因为他故意在数据库里面添加了几位假名人(他的朋友)的资料,为的就是想看看这些人会不会被Google当作精选回答弹出来,结果真的是这样。

Warner说:“我们的流量马上急转直下。2017年1月跟2016年1月(当时整个月他们的内容还没有被剽窃)的流量相比,我们的流量下降了65%。”Warner说自己被迫裁掉了1半员工。(在被询问到这种损害自身最好信息来源的举动是否搬起石头砸自己的脚时,Google拒绝发表评论)。

Celebrity Net Worth用了Google的广告网络,于是他试着通过那一块的联系方式接触Google。最后并不走运。当他意识到Google很多的精选摘要并没有把CelebrityNetWorth的名字放上去时,他沮丧的心情遭到了双重打击。很多链接跑到了其他网站,比如房屋抵押网站Bankrate.com,可笑的是甚至那些网站也把CelebrityNetWorth作为自己的来源。

Google是如何吞噬了这家网站的?

搜索“梅威瑟身价”直接从Bankrate.com提取出来的答案,而这个答案Bankrate.com其实是援引另一来源的。

Warner承认,如果网站搜索流量太过倚重Google,而它的研究成果轻易就能被转化为数字的话,搭建这样的网站是有风险的。但他仍然认为Google的做法是不公平的。他说:“如果精选摘要还留下不走,没关系。我对此已经不再计较。但我百分之一百认为我们对此应该是有功劳的。”

Google决定小企业成败的能力显而易见。之前其实也发生过类似的事情,去年该搜索引擎添加了“当地企业名片(Local Business Cards)”,这个东西基本上就是高亮显示地区企业的搜索结果。其结果是,致力于让自己的网站在Google排名靠前的当地企业突然被更新更频繁的网站挤到了一边。2011年Google+的推出也对小型企业有类似的效应,毁灭性的Panda更新也是这样,这项升级本来是想打击垃圾内容网站的,可最后把小型网站的一切都搞砸了。

Google推进直接答案的后果远不止是依赖搜索流量的小型企业主受影响。Google2014年发给Warner的电子邮件让我们稍微了解了一点Google挑选可信来源的办法是什么样的。Google自己当然不会回答这个问题,但基于这封电子邮件,Google的内容审查应该是相当薄弱的,相对于数据是否正确,Google似乎对数据是否机器可达更感兴趣。而精选摘要(利用算法从web挑选出来的答案)的门槛甚至还要更低,因为看起来任何在搜索结果中排名足够靠前的网站都足以充当Google标准答案的来源。所以你才会搜到一大堆结果说奥巴马正在组织一场政变,或者说地球是平的,或者女人是邪恶的,或者这位艺术家发明了电子邮件。

还应该引起注意的是,知识图谱和精选摘要的答案所提供的文字也会被Google的语音助理和Google Home大声宣读出来——他们迫不及待推出显然带有瑕疵的功能的动机很大一部分就因为此。

截止到写稿时,“Larry David的身价”以及“Larry David值多少钱”的查询返回的都是9亿美元,但来源都是Business Insider。Business Insider的故事说“据估计”Larry David身家有9亿美元以上,并且链接到了财富市场洞察机构Wealth-X的一份新闻公告。然后再引用了CelebrityNetWorth稍低一点的4亿美元,并且引用Larry David在跟Charlie Rose对话时的说法,当时他说自己身家连5亿美元都不到。

Google是如何吞噬了这家网站的?

2017年4月17日Google搜索“Larry David净值”的结果,这个结果似乎出自Google编撰的知识图谱数据库。

这个数字远谈不上决定性,但Google似乎愿意为此背书——不管是Google自己编撰的知识图谱还是不那么严谨的从web抓取答案的精选摘要都是这样(精选摘要通常附带有“关于本结果”的说明,而知识图谱的回答就没有)。

Google是如何吞噬了这家网站的?

2017年4月17日搜索“Larry David值多少钱?”的结果,上面显示了自动从web抓取的精选摘要。

Google的答案总是在变,有时候会有改善,但并不总是这样,而且Google也没有具体说明过自己是如何处理用户通过知识图谱和精选摘要内置的“反馈”表格提交的评论的。

关于本文Google进行了如下的回应:

精选摘要是对搜索查询的自动算法性匹配,回答摘要是出自第三方网站的。这些网站汇总精选摘要的底部显示,用户可通过Google搜索的精选摘要点击链接直接进入这些网站。我们一直致力于改进算法,并且欢迎对不准确的信息提供反馈,用户可通过点击精选摘要右下角的“反馈”按钮分享自己的意见。

在Warner把这个故事分享给我的2周之后,他注意到精选摘要做出了改变。Google展示的抽取结果似乎变少了,精选摘要显然剔除了不那么出名的名人的信息。CelebrityNetWorth的流量涨回来了,尽管还没有恢复到原先水平。他说:“我还不能完全打开香槟,因为如果你经历过我在过去2年所经历的一切的话,你就会知道对于Google所做的事情永远都不要高兴得太早。这可能只是他们在推出比以前还要糟糕的东西之前的一次缓期执行罢了。”

相关阅读

推荐阅读

两连阳为啥还没回本?买入绩优、白马、中大盘股才能轻松获利

两连阳为啥还没回本?买入绩优、白马、中大盘股才

一、大盘点评展望周二沪深两市小幅低开后,沪深300权重带动指数震荡上行。最终沪指上涨0 53%报收3410点,K线上收出一根中阳线;深成指上涨1 更多

2017-11-22 16:17:00
2017百度世界大会李彦宏透露无人车2018年量产 无人驾驶概念股备受期待

2017百度世界大会李彦宏透露无人车2018年量产 无

一年一度的百度世界大会11月16日在北京举行,每年的百度世界大会,百度创始人李彦宏都会带来他对过去,现在和未来关于互联网和整个IT领域的 更多

2017-11-16 11:17:37
贵州茅台股价突破700元 贵州茅台股价为什么那么高?

贵州茅台股价突破700元 贵州茅台股价为什么那么

今日贵州茅台延续昨日强势走势,继续大幅攀升,盘中最高价突破700元整数关口,刷新上市新高纪录,截至发稿,最高价报704 97元,总市值超越8 更多

2017-11-16 10:32:47
百度世界大会今日召开聚焦智能硬件 百度世界大会受益概念股一览

百度世界大会今日召开聚焦智能硬件 百度世界大会

据怀新资讯报道,2017百度世界大会将于16日在北京举行。从邀请函上出现的神秘的盒子推测,本次百度将会有AI硬件以及诸多AI新技术发布。从今 更多

2017-11-16 10:17:03
中国财富总值全球第二但是超4亿人家庭没有卫生厕所 你拖后腿了吗?

中国财富总值全球第二但是超4亿人家庭没有卫生厕

瑞士信贷研究所(CSRI)最新出炉的《全球财富报告》显示,全球财富总额现已达到280万亿美元,比十年前金融危机爆发时高出27%。美国占全球财 更多

2017-11-16 10:07:07
比特币今日价格大幅反弹逾9% 比特币价格再次突破7000美元

比特币今日价格大幅反弹逾9% 比特币价格再次突破

在短短两周时间内,比特币价格呈现了非常惊险的过山车。由于对于这款加密货币未来趋势存在争议,上周比特币价格出现暴跌,曾一度低于6000美 更多

2017-11-16 10:04:14
油价调整最新消息:国内油价今日24时或迎年内最大涨幅 附92号/93号汽油最新价格

油价调整最新消息:国内油价今日24时或迎年内最大

新一轮成品油调价窗口将于16日24时开启。国际原油价格一度涨至近两年高位,受此影响,国内油价或迎年内最大涨幅。隆众资讯统计数据显示,以 更多

2017-11-16 09:22:17
国际油价调整最新消息:EIA原油及汽油库存双双增长 延长减产协议预期支撑油市反弹

国际油价调整最新消息:EIA原油及汽油库存双双增

美国能源信息署(EIA)周三(11月15日)公布的数据显示,上周美国原油库存意外录得增加,同时汽油库存也意外增长。EIA公布,截至11月10日当 更多

2017-11-16 09:21:49
+ 点击查看更多精彩
今年政策方向没有变,“三去一降一补”具体该怎么干?
    2018年,我国开启高质量发展新征途。中央经济工作会议把深化供给...
蓝筹股带动大盘继续上攻 沪指重返3400点
    【盘面简述】今日早盘,随着油气股的拉升上涨,中国石油和中国石...
白马股崛起补涨强烈 短期恐慌性抛盘并不大
    今日市场点评:沪深两市早盘各股指纷纷小幅低开,开盘之后一度呈...
市场再度面临重要的时间窗口 一板块有望迎来年末行情
    【今日小结】今日,两市小幅高开,开盘回撤后快速上行翻红,金融...
不离谱的回落 三理由力挺节后机会
    今日市场点评:大盘在节后第一天走出了高开低走的行情。在国庆期...
第三批混改试点企业名单不久后推出 军工、民航、通信混改机会尤为突出
    国新办今日举行新闻发布会,国资委副秘书长彭华岗在回答记者关于...