腾讯秘密孵化的资讯类AI产品长什么样

来源:当代财经网时间:2017-04-19 15:13:32

腾讯秘密孵化的资讯类AI产品,到底是什么样的?

人工智能与新闻资讯类产品结合会产生怎样的化学反应?腾讯可能很快就会揭晓这一答案。

近日,腾讯举办了一个小型的媒体沟通会,腾讯网财经中心副总监刘康介绍了写稿机器人Dream Writer的最新成果以及腾讯网内部正在孵化中的资讯类AI产品。

腾讯的写稿机器人最初获得关注,是因为2015年9月发布的一篇由Dream Writer写就的财经新闻。当时,引起了“机器人是否会取代人”的大讨论,尤其是给很多媒体从业者带来了一丝忧虑。

但用机器人写稿已经不是什么大新闻,当时很多国外媒体已经在使用。经过这几年的发展,国内媒体如第一财经、新华社都已经尝试让机器人写稿。

加之拥有各种算法和数据的AI的普及,让一切都变的智能已经是一种不可逆的趋势。为了应对AI的发展,特斯拉CEO马斯克就曾说,未来的人会变成半机械人;而李开复博士也围绕“人工智能会取代50%的工作”进行过多次演讲,并称人类只能选择去做热爱且有深度的事情才可能取得优势。

如今,再提及写稿机器人,很多人可能都觉得司空见惯。但如何将人工智能更好的应用到媒体创作中并为人类所用,可能才是大多数人所关注的。此次腾讯正在孵化的资讯类AI产品,正是想要做用户的超级资讯类服务秘书。

写稿机器人半年写稿30万篇

"像财报、宏观数据变动、板块变动都需要出快稿,而且还是大量枯燥的工作。当时大家就在想可不可以让机器人来做,这样很多小朋友就可以做更有创造力的事情。”腾讯网财经中心副总监、内容机器人团队负责人刘康介绍了用机器人写稿的初衷。

2014年12月,团队开始筹划并建立数据库。2015年3月,写稿机器人项目正式启动。经过半年的测试后,写稿机器人Dream Writer于2015年9月正式上线。如今又过了一年多,这个写稿机器的写稿能力达到了什么程度?

事实上,腾讯对于这款Dream Writer并没有做过多的宣传,但它其实一直在默默耕耘。在奥运会期间,就第一次大规模运用了Dream Writer。其中,第一块金牌的新闻就是出自写稿机器人。

“我们不认为非要署一个什么名,说是机器人写的,如果是机器写的,也不错,就可以了。再一个外部搜索都会搜到,我们也没有对外展示过,所有奥运期间的稿子为3600篇稿子。”刘康说道。

除了在奥运期间的大规模使用,腾讯体育APP里小梦战报页卡里的全部内容也都是Dream Writer写的。稿件量方面,每天上市公司A股有2000多家,保守估计每天有2、3千篇的稿件。

目前,Dream Writer应用领域包括财经、体育、科技、新闻。这里的新闻是指一些社会类的、天气、基于地理位置的。

统计来看,写稿机器人半年真实的稿件量为30万篇。可见机器人的生产力颇高,但团队暂时还没有考量怎么商业化。

除了常规的财经、科技稿外,内容机器人团队未来还要开发全品类,而且这是未来一年内甚至更长时间内要深耕的东西。

这些稿件是怎么生产出来的?

首先要开发品类,比如体育的品类大类别不是很大,但每个细分领域特别的细,足球的话就包括法甲、中超、英超、意甲等,篮球包括NBA、CBA等。目前,机器人已经把体育的所有品类都开发完了。

接下来就是文本。机器人写稿的话,从零到一相对简单,但从零到二、从一到三则需要更多的精力。比如体育报道,根据文本范式可以做一个基本的描述,进行模块化的写作。但今天的数据量可以描述到每一个数据的颗粒还原。

“以跳水的稿子为例,因为跳水是一个评分制的比赛,评委要给每一个动作,如走板、空中姿态、落水姿态、水花等打分,这些打分都会被录入数据库。然后,这些数据会被我们通过一定的算法和机器识别,先让机器跑几十万篇的数据,跑一个规则出来,它会自己把这些数据重新还原。因为每一个分数都可以还原成一个动作,这样我们通过一定的算法把它还原成原先的场面这就是可行的。”刘康介绍机器写作时的逻辑说道。

对这些新闻进行简单的报道没有太多的技术含量,但难点在于对数据的解读、判断以及对未来的预测。

再说到体育,可以从数据中得知某一个球队的得分。刘康认为,“难点在于描述本身,因为写的像人写的,表述需要很精彩、有亮点我才会去看,如果写的不精彩、不真实的话我会去欣赏原来的视频,欣赏它的动作就可以了。”又比如一些新闻,如何让机器人写深度、甚至行业研报、垂直类类研究,这都是挑战。

在技术方面,主要涉及智能撰文技术、内容抽取技术和要闻萃取技术,而且这三项技术均已拿到国家专利。以内容抽取技术为例,它可以把一篇1000字-2000字的文章概括为200字、300字和500字。目前,该技术还在不断优化,而且还有好多种类。

不同的技术,对文章抽取有差异,从普遍应用角度来讲基于统计学原理的文章更适合财经类这样数据量特别颗粒化的领域。而其他的品类团队会单独的研发,因为不同的领域有不同的特点。

据刘康介绍,写稿机器人的运营事故零起。但像人一样,机器也会犯错,有时还是逻辑错误。目前,腾讯花了很大精力在内容风险管控上,一是机器写的时候会单独做一个算法和规则判断写的有没有问题,二是要经过团队的安全审核。这之后才能推出来。

一款可以帮助到你的资讯类AI产品正在孵化中

除了介绍Dream Writer的写稿情况外,刘康还重点介绍了机器人团队正在孵化的资讯类AI产品,这是一款超级资讯类服务秘书产品。而且该产品不同于腾讯旗下的腾讯新闻和天天快报以及今日头条。

如今各种新闻资讯类产品占据了用户太多时间,而机器人团队希望可以做一款可以释放用户时间的产品。这一概念也是腾讯旗下产品微信所看重的。

在这样的情况下,一款叫Dream Reader的产品诞生了。它是基于Dream Writer的机器写作技术和内容抽取技术而产生的。

这到底是一款什么样的产品,刘康这样描述:

我每天上班要做好多好多事情,我需要对大量资讯进行了解,每天了解新闻的过程会占我大概1到2个小时的时间,这个时间如果我省下来会怎么样?我希望打开一个应用,好像我请了一个助手,早上我问助手说,你帮我整理一下今天的重要新闻,一分钟告诉我就好了,然后我就去开会。我大概想做这样一个产品。

另外,这款产品不仅可以“问”用户喜欢什么,而且可以根据用户的需求变化以及新闻的重要性进行推荐。

虽然目前该产品还不成熟,但刘康介绍了此类优秀产品的标准。如国外的一款实时快讯APP,他几乎没有打开过,但会消息会被推送到通知中心,他扫一眼就会知道发生了什么。“从DAU来讲它没有多少,因为我没有打开过它,时长更没有了,但是它对我是有用的,对我有帮助。”

所以,他希望正在孵化中的这款产品,可以不用这些衡量标准,而是可以帮助到用户。

而且这是一个个性化资讯生产和服务平台,而有别于单纯的新闻平台。它可以应用到很多场景,包括天气、汽车、娱乐、科技、重大政策,资产管理等。

在资产管理方面,比如说可以推送一下最近我买的股票怎么样、投资基金亏了多少钱,最新的房地产政策对学区房的影响等。

在当天的沟通会上,记者体验了一下该产品的测试版。它具有语音播报功能,而且可以通过输入关键词语音检索相关信息。但目前的用户体验还不是很好,而下一个版本还要弱化语音播报功能。

该产品什么时候上线还没有确定的时间,不过为了更加成熟已经延期。

相关阅读

特斯拉汽车Model X在华爆炸 车主要求巨额赔偿
    5月1日消息,今年2月一辆特斯拉Model X在广州发生碰撞事故后起火...
林卓延主席被授予“圣亚加塔‘都尉’荣誉”勋章
    林卓延主席到访圣马力诺参观考察,并被授予“圣亚加塔‘都尉’荣...
“泛金融”业务促进新昌集团产业升级
    新昌以建造为核心而闻名港澳及东南亚地区,业务亦覆盖开发及投资...