谷歌吞噬了这家网站意味着什么

来源:当代财经网时间:2017-04-19 16:55:51

Google 搜索结果里的 Featured Snippets 小卡片直接显示答案,用户就比较不用从搜索结果里点击链接了,这也导致很多依赖搜索引擎引流的网站的访问量大幅度下降

诞生于2008年的CelebrityNetWorth.com之所以出现,是因为学金融的Brian Warner在一家数字媒体公司工作时很好奇Larry David值多少钱。

“说实话,我想知道Larry David到底有多少钱。我想《抑制热情》刚刚回归,于是我想‘上帝,他一定从《宋飞正传》赚了很多的钱。’我去Google查了类似‘Larry David净值’这样的东西,结果出来的都是垃圾。”

按照CelebrityNetWorth.com的说法,Larry David现在的身价是4亿美元。Warner承认这不是确切的数字,但这个数字不是他和自己的员工随便乱想出来的。他们翻看了房地产交易、数额较大的购买和薪水支付,有时候甚至还跟名人或者名人的代表联系求证。弗洛伊德·梅威瑟的身价Warner估计是被Google最多的,这位以花钱大手大脚著称的拳王甚至给网站传了自己资产账户的截图。

不过Warner警告说:“我不建议你把我们的这些数字用到诉讼案上面去。但我绝对可以打包票的是,在名人身价方面任何时候我们的资料都是你在互联网上能找到的、最准确的信息。”

名人身价多少这个问题火了,火到2012年Warner可以连原来的工作都不要全身心投入到这个网站上。他说网站最高峰的时候一度拥有12名员工。

然后Google插了一脚进来。

大部分时候Google的表现都是像图书管理员一样。你提出问题,它引导你去到web上有可能找到答案的地方。

Google是如何吞噬了这家网站的?

在接受“Google会不会犯错”这个问题查询时Google的直接回答

但是过去5年的时间里,Google一直在进行当圣人的实验。输入问题,然后你可能会在搜索结果页面顶部看到一个方框,里面用加粗体标注了相关问题的答案。复活节是什么时候?谁赢得了《美国好声音》?狗可以吃寿司吗?

Google是如何吞噬了这家网站的?

搜索“狗可以吃寿司吗”返回的Featured Snippet(精选摘要)片段,截图时间是2017年4月17日

这些回答当中有一些包括了源自Google编撰的Knowledge Graph(知识图谱)数据库的信息。大部分数值型和日期型的问题答案都出自这里,此外有些答案是从Google所信任的维基百科抽取出来的。

但有些回答是没有办法人工编撰的,而是利用算法从网上抽取出来的。这些叫做“Featured Snippets(精选摘要)”,在过去已经给Google惹来了麻烦,因为该搜索引擎无意间突出显示了一些带有种族主义、性别歧视或者明显错误的回答。

最终目标是增强用户进行Google搜索的体验……

2014年,Warner收到了一封Google的邮件,询问他是否对免费让该公司访问他的数据来给知识图谱取材感兴趣。

以下是这封邮件的片段:

我们收到了大量有关名人身价方面的搜索查询。有人让我找一个权威的来源,现在我正在研究Net Worth of Celebrities数据集的信息源。最终目标是增强用户进行Google搜索的体验……我正在评估你的网站,你的收集看起来似乎挺全面的……如果你能共享一小部分数据集,也就是大概10位名人的元数据到电子表格里面的话,将有助于我和我的团队评估,看看是否符合我们的条件。

如果同意的话,这将意味着对名人身价的任何Google搜索都将返回抽取出来的答案。答案将包括到Warner网站的链接,Google向他许诺说此举将有助于网站打响品牌。但这也会急剧削减他的流量。大多数人只是想知道数字,对于这些数字是怎么得出的并不在意。所以Warner拒绝了。

他说:“我不知道这对我们有什么好处。我要给它打上一个大大的问号,就好像说‘嘿,让我们挖走你手上最值钱的东西,那些你花了好几年数百万美元才搞到的东西,然后免费给我们好显示出来。’所以最后我们回应说‘我们对这种做法感到不舒服。’”

“但随后他们更进一步把数据取走了。”

Warner说,2016年2月,Google开始展示CelebrityNetWorth数据库中25000位名人的精选摘要。他之所以知道是因为他故意在数据库里面添加了几位假名人(他的朋友)的资料,为的就是想看看这些人会不会被Google当作精选回答弹出来,结果真的是这样。

Warner说:“我们的流量马上急转直下。2017年1月跟2016年1月(当时整个月他们的内容还没有被剽窃)的流量相比,我们的流量下降了65%。”Warner说自己被迫裁掉了1半员工。(在被询问到这种损害自身最好信息来源的举动是否搬起石头砸自己的脚时,Google拒绝发表评论)。

Celebrity Net Worth用了Google的广告网络,于是他试着通过那一块的联系方式接触Google。最后并不走运。当他意识到Google很多的精选摘要并没有把CelebrityNetWorth的名字放上去时,他沮丧的心情遭到了双重打击。很多链接跑到了其他网站,比如房屋抵押网站Bankrate.com,可笑的是甚至那些网站也把CelebrityNetWorth作为自己的来源。

Google是如何吞噬了这家网站的?

搜索“梅威瑟身价”直接从Bankrate.com提取出来的答案,而这个答案Bankrate.com其实是援引另一来源的。

Warner承认,如果网站搜索流量太过倚重Google,而它的研究成果轻易就能被转化为数字的话,搭建这样的网站是有风险的。但他仍然认为Google的做法是不公平的。他说:“如果精选摘要还留下不走,没关系。我对此已经不再计较。但我百分之一百认为我们对此应该是有功劳的。”

Google决定小企业成败的能力显而易见。之前其实也发生过类似的事情,去年该搜索引擎添加了“当地企业名片(Local Business Cards)”,这个东西基本上就是高亮显示地区企业的搜索结果。其结果是,致力于让自己的网站在Google排名靠前的当地企业突然被更新更频繁的网站挤到了一边。2011年Google+的推出也对小型企业有类似的效应,毁灭性的Panda更新也是这样,这项升级本来是想打击垃圾内容网站的,可最后把小型网站的一切都搞砸了。

Google推进直接答案的后果远不止是依赖搜索流量的小型企业主受影响。Google2014年发给Warner的电子邮件让我们稍微了解了一点Google挑选可信来源的办法是什么样的。Google自己当然不会回答这个问题,但基于这封电子邮件,Google的内容审查应该是相当薄弱的,相对于数据是否正确,Google似乎对数据是否机器可达更感兴趣。而精选摘要(利用算法从web挑选出来的答案)的门槛甚至还要更低,因为看起来任何在搜索结果中排名足够靠前的网站都足以充当Google标准答案的来源。所以你才会搜到一大堆结果说奥巴马正在组织一场政变,或者说地球是平的,或者女人是邪恶的,或者这位艺术家发明了电子邮件。

还应该引起注意的是,知识图谱和精选摘要的答案所提供的文字也会被Google的语音助理和Google Home大声宣读出来——他们迫不及待推出显然带有瑕疵的功能的动机很大一部分就因为此。

截止到写稿时,“Larry David的身价”以及“Larry David值多少钱”的查询返回的都是9亿美元,但来源都是Business Insider。Business Insider的故事说“据估计”Larry David身家有9亿美元以上,并且链接到了财富市场洞察机构Wealth-X的一份新闻公告。然后再引用了CelebrityNetWorth稍低一点的4亿美元,并且引用Larry David在跟Charlie Rose对话时的说法,当时他说自己身家连5亿美元都不到。

Google是如何吞噬了这家网站的?

2017年4月17日Google搜索“Larry David净值”的结果,这个结果似乎出自Google编撰的知识图谱数据库。

这个数字远谈不上决定性,但Google似乎愿意为此背书——不管是Google自己编撰的知识图谱还是不那么严谨的从web抓取答案的精选摘要都是这样(精选摘要通常附带有“关于本结果”的说明,而知识图谱的回答就没有)。

Google是如何吞噬了这家网站的?

2017年4月17日搜索“Larry David值多少钱?”的结果,上面显示了自动从web抓取的精选摘要。

Google的答案总是在变,有时候会有改善,但并不总是这样,而且Google也没有具体说明过自己是如何处理用户通过知识图谱和精选摘要内置的“反馈”表格提交的评论的。

关于本文Google进行了如下的回应:

精选摘要是对搜索查询的自动算法性匹配,回答摘要是出自第三方网站的。这些网站汇总精选摘要的底部显示,用户可通过Google搜索的精选摘要点击链接直接进入这些网站。我们一直致力于改进算法,并且欢迎对不准确的信息提供反馈,用户可通过点击精选摘要右下角的“反馈”按钮分享自己的意见。

在Warner把这个故事分享给我的2周之后,他注意到精选摘要做出了改变。Google展示的抽取结果似乎变少了,精选摘要显然剔除了不那么出名的名人的信息。CelebrityNetWorth的流量涨回来了,尽管还没有恢复到原先水平。他说:“我还不能完全打开香槟,因为如果你经历过我在过去2年所经历的一切的话,你就会知道对于Google所做的事情永远都不要高兴得太早。这可能只是他们在推出比以前还要糟糕的东西之前的一次缓期执行罢了。”

相关阅读

特斯拉汽车Model X在华爆炸 车主要求巨额赔偿
    5月1日消息,今年2月一辆特斯拉Model X在广州发生碰撞事故后起火...
林卓延主席被授予“圣亚加塔‘都尉’荣誉”勋章
    林卓延主席到访圣马力诺参观考察,并被授予“圣亚加塔‘都尉’荣...
“泛金融”业务促进新昌集团产业升级
    新昌以建造为核心而闻名港澳及东南亚地区,业务亦覆盖开发及投资...