京东莎士比亚AI智能文案2.0上线 实现整段文案写作打破AI行业瓶颈

来源:央广网时间:2018-07-26 11:42:01

  近日,京东“莎士比亚”AI智能文案系统2.0正式上线。与1.0相比,2.0系统可生成完整的文案段落。在语言表达上更贴切,描述更为精准与切题,此外表达的方式也更加丰富。京东AI研究院常务副院长、深度学习及语音和语言实验室主任何晓冬博士透露,在保证AI能够实现基础的文字表达后,京东正在将人类的情感表达以及更为高级的修辞手法例如比喻、排比、拟人等技巧融入其中。

  京东AI研究院常务副院长、深度学习及语音和语言实验室主任何晓冬博士

  在2.0的版本中写作能力有了大幅提升,且表达丰富性等方面均取得了长足进步,能够帮助商家实现在服饰、居家、个护化妆等品类上的商品详情描述工作,大幅提高商家的工作效率。而京东也在不断加大AI智能写作的投入,目前已经汇聚了京东AI研究院以及京东美国硅谷研究院 。

  京东莎士比亚2.0上线

  从单句到段落文案的一小步AI的一大步众所周知,相较于单句文案写作,段落文案的生成难度,无论是底层数据库支撑,还是算法难度上都更具挑战性,不仅要考虑句子与句子之间的起承转合,还需保证各分句之间围绕同一主题进行描述,否则生成的文案有可能出现不切题,句与句之间自相矛盾的风险。京东“莎士比亚”2.0系统打破了这一瓶颈,在长文案的写作上迈出了坚实的一步。当前莎士比亚能够根据商家的需要,仅输入与商品相关的几个关键词例如“连衣裙”“雪纺”“高跟鞋”三个关键词,点击生成按钮,即可生成多个与之相匹配的文案描述。

  根据关键词自动生成产品文案

  可以看到“莎士比亚”2.0系统能够判定用户输入的多个关键词之间,何为中心词、何为搭配词,避免主次不分、描述混乱的现象。除了关键词,商家还可以输入商品的SKU生成文案,且可对生成的文案内容做编辑修改,并添加至个人收藏,而机器则会根据用户修改情况,判别内容优劣,下次展示时做出顺序调整。

  该项目负责人谈到:“即便是一些不太常见的关键词,“莎士比亚”系统也能生成段落,这源于我们系统上建立的庞大文案数据库,能覆盖商品详情页文案中出现的主流描述用语。”

  大规模集成机器学习技术突破AI“语言障碍

  莎士比亚2.0的品类覆盖扩展至服饰、居家到美妆个护,在短短的3个月里就完成了迭代,其中离不开京东硅谷研究院前台产品算法团队与京东AI研究院的通力协作,使其在算法优化上提供了强大的技术保障。“莎士比亚”系统采用的主要算法,是根据用户输入的主题词自动扩展主题词,自动筛选出最优的候选主题词序列方案和自适应学习方案,利用大量的数据训练seq2seq模型后,经过不断优化和迭代得到最终符合任务要求的模型。对于此次迭代所实现的段落描写,系统则是基于大规模集成机器学习技术,结合语义理解、篇章分析、近义词匹配、情感分析等自然语言处理技术,自动生成切题、通顺、有感染力的文案。相对于端对端纯粹从数据生成文案的方式,该方法的优势就在于融合了数据和语言学知识,生成出来的文案可读,且准确匹配输入信息。能够真正达到言之有物、打动读者的目的。

  通过京东AI研究院与京东硅谷研发团队分工协作,既利于单一品类的做深、做精,又利于多品类的齐头并进,双方技术交流分享互通有无,避免重复研发、提升效率。最终生成的文案结果会由专业的文案同事进行打分,研发人员根据打分情况做出修正,并根据业务方的实际需求做出模型调整。

  向高级写作进发 让阅读产生共鸣

  硅谷研究院陈力博士表示,AI高级写作刚刚开始,莎士比亚将会向高级写作发力,让机器写出的文案让阅读者产生共鸣般的体验。而要实现这一点,京东将会集中在以下三点来发力。

  京东美国硅谷研究院陈力博士

  第一,理解词语本意并进行扩展,对于商品描述的写作,难点就在于对关键词本身的延展,例如我们输入裙子,计算机能够理解裙子的意思同时围绕它能够延展出裙子样式的描写、材质的描写、搭配的描写等等,这是十分困难的,尤其是结合商品本身的功能特色,引申出贴切、抽象的场景与画面,需要机器具备类似人类大脑神经元般的联想机能,而这绝非轻而易举,需对数以万计的汉语词汇建立映射关系,“喂”给机器学习。第二,文案风格的准确与丰富。文案的写作风格能够根据商品本身的性质去撰写出恰当的文案风格进行表达,同时京东基于BI(商业智能)已经实现了对用户推荐商品的丰富多变,如广告语、发现好货文章、商品详情页等文案,也能根据用户画像实现智能推送。第三,押韵美感及平仄韵律的塑造。中国文字博大精深,特别是修辞手法的多元化,汉语写作中常见的比喻、排比、拟人等修辞手法,一直以来都是人工智能领域的难题。而要做到韵脚的美感和平仄节奏的变化也是目前人工智能不断在探索的课题。“莎士比亚”系统要产出高质量文案,自然绕不开这一研究课题,计划在3.0阶段将加入韵律库并能够有平仄的韵律感,上下句衔接时,借助丰富同义词、近义词库的替换引用,就会降低不押韵的概率,使得文案读起来朗朗上口。

  随着对AI写作的不断深入,我们不仅能够通过AI帮助实现基础的文字描述,更能够在广告、营销等行业上去使用,帮助文字工作者通过AI的创造能力汲取灵感,对合作伙伴来说能够降低其文案写作方面的人力成本。在无界零售的推进下,京东作为零售基础设施服务商,希望将自身优质的AI技术转变成为基础服务的能力,而莎士比亚正是这一能力的很好案例,通过莎士比亚京东希望能够为文字工作者带来更加便捷的文字创作,让更多人享受AI创造的美好生活。

相关阅读

推荐阅读

北京:新机场高速路计划明年上半年建成南五环至机场仅需20多分钟

北京:新机场高速路计划明年上半年建成南五环至机

原标题:新机场高速路计划明年上半年建成北京大兴国际机场高速公路建设完成超七成摄影 本报记者 黄亮北京青年报记者昨日从北京市交通委了 更多

2018-11-22 10:10:04
税总出台26条措施力助民企发展

税总出台26条措施力助民企发展

为深入贯彻落实习近平总书记在民营企业座谈会上的重要讲话精神,切实发挥税收支持和服务民营经济发展的职能作用,近日,国家税务总局印发《 更多

2018-11-20 10:10:00
两连阳为啥还没回本?买入绩优、白马、中大盘股才能轻松获利

两连阳为啥还没回本?买入绩优、白马、中大盘股才

一、大盘点评展望周二沪深两市小幅低开后,沪深300权重带动指数震荡上行。最终沪指上涨0 53%报收3410点,K线上收出一根中阳线;深成指上涨1 更多

2017-11-22 16:17:00
2017百度世界大会李彦宏透露无人车2018年量产 无人驾驶概念股备受期待

2017百度世界大会李彦宏透露无人车2018年量产 无

一年一度的百度世界大会11月16日在北京举行,每年的百度世界大会,百度创始人李彦宏都会带来他对过去,现在和未来关于互联网和整个IT领域的 更多

2017-11-16 11:17:37
百度世界大会今日召开聚焦智能硬件 百度世界大会受益概念股一览

百度世界大会今日召开聚焦智能硬件 百度世界大会

据怀新资讯报道,2017百度世界大会将于16日在北京举行。从邀请函上出现的神秘的盒子推测,本次百度将会有AI硬件以及诸多AI新技术发布。从今 更多

2017-11-16 10:17:03
MSCI中国A股指数大调整 msci中国a股指数成分股名单一览

MSCI中国A股指数大调整 msci中国a股指数成分股名

11月13日晚,明晟公司(MSCI)在半年一度的指数评估中,公布了对MSCI中国A股指数、MSCI中国全部股票指数的最新重大调整。公告显示,MSCI中 更多

2017-11-15 14:43:49
风云三号D星凌晨成功发射 风云三号d星概念受益股有哪些?

风云三号D星凌晨成功发射 风云三号d星概念受益股

今天凌晨,长征四号丙运载火箭发射风云三号D星。中国航天科技集团供图新京报快讯(记者倪伟)今天(11月15日)2时35分,我国风云三号D星在 更多

2017-11-15 09:26:44
1953年三元纸币价格表 第二套人民币的发行具有怎样的纪念意义

1953年三元纸币价格表 第二套人民币的发行具有怎

【藏品名称】第二套人民币53年叁圆井冈山【藏品类别】人民币单张【发行时间】1955年3月1日【停用时间】1964年5月15日【发行量】限量【面值 更多

2017-11-14 16:24:17
+ 点击查看更多精彩
31省份今年GDP目标全出炉 推动高质量发展成聚焦点
    随着山东省两会的召开,目前31省份2019年政府工作报告全部出炉,...
基金子公司资管规模2年降幅近50%
    中国证券投资基金业协会日前发布数据显示,截至2018年底,证券期...
11地楼市探路一城一策 房地产调控最严时期已过?
    资料图:楼市。孙睿 摄门槛微调 11地楼市探路一城一策青岛、菏...
阿里全球数学大赛决赛开战 难度堪比博士入学考试
    近日,阿里巴巴全球数学大赛决赛开战,全球11个国家300多位数学高...
北京:新机场高速路计划明年上半年建成南五环至机场仅需20多分钟
    原标题:新机场高速路计划明年上半年建成北京大兴国际机场高速公...
IEEE HotlCN 2018:成就区块链未来的是需求,而非技术本身
    8月14日,由北京大学深圳研究生院、深圳众享互联科技有限公司以及...