十问京东副总裁翁志:人工智能的再次跃进 要回归到数据挖潜

来源:央广网时间:2018-07-05 19:07:26

2017年是人工智能爆发的元年,但今年以来,AI步入更加冷静的状态,那么AI新的驱动力是什么呢?近日,AI商业周刊记者与京东副总裁、京东大数据平台负责人翁志进行了一场深入对话,他分享了对这个问题的看法。此外,我们还探讨了京东大数据平台规划、AI芯片、无界零售等话题。本文共十个问题,从不同维度深度碰撞,干货满满。

01

2018年以来AI步入更加冷静的状态,AI新的驱动力是什么?

翁志:

AI技术发展当中,数据基础和数据的处理能力是非常重要的。人工智能的底层是数据,数据越多,我们可以看到的现象越全面。

每年京东产生和要处理的数据量都是翻番的、倍增的,这源于我们对于入口的掌握,数据流越来越多,数据量越来越大,来自于手机、端、内部产生的各种各样的数据。

数据量越来越多就产生一个问题:如何有效管理?

我们的任务就是在数据的增长情况下,让数据的实效性增长、数据处理能力倍增,但是服务器的数量和投入是有一个有序、可控的增长,而不是跟着数据的增长倍增。

这背后,涉及到软硬件一系列的改造和增进,需要很多内部的软件挖掘。

市场有很多开源软件,是针对通用的使用方式,而不是为一个特定的需求进行定制。开源软件在一定的数据范围内达到一定的效能是OK的,当我们增长超过这个范围,它的性能会急剧下降。我们就要对这个软件进行深度定制,打破它的瓶颈,处理更大规模的数据。

总结数据处理的核心价值就两个:一个是降低成本,包括运营成本和维护成本;另一个是提升效率,在没增加硬件投入情况下,软件效率提升是线性提升,在有限投入下,对公司开源节流节省大量成本。

02

京东大数据平台未来有怎样的规划?

翁志:

我们曾经和国内BAT及一些独角兽公司做过深刻的技术交流,大多数公司都是使用开源软件搭建大数据平台。就像找来不同的施工队盖了许多不同高度,不同规格的房子,整个小区的效果可想而知。

我们的思考是按照用户的需求,进行有效合理统一的规划,比如说,底层存储硬件,如何使用硬盘、SSD、NvMe的SSD、Optane,甚至未来的AEP进行有机的组合将成本与效能进行合理的搭配;硬件上面的软件存储层是HDFS和有限的scalable的分布式文件系统组成,可以支持不同类型的数据存储,对于冷数据通过有序的搬迁和擦除。对于它之上的数据存取,根据用户的不同需求API化。降低使用过程中不必要的复杂度。

同时,利用深度学习将整个数万台服务器的IO使用以及数据分布进行有效分析,并且通过增强学习的方式指引调度器控制数据的分布和使用等等。应该说京东大数据对于未来数据平台的发展规划已经有了完整的规划。

03

你们具体是如何将数据转化成产品的?

翁志:

这涉及到对不同行业的深刻理解,针对行业特点,做有针对性的数据分析。我们通过深度学习的方式找出规律、趋势,给用户提供反馈,做预测,决策。

例如,化妆品的种类很多,通过数据可以知道某一类化妆品在全国各地的销售情况;同品类这些细分化的产品在什么地区好卖。我们可以分析出这个产品在哪些城市做得不足,这些产品缺少哪些用户所喜好的特性,它的竞争者有哪些缺失。

机器可以根据销量做预测,分析同类化妆品哪些特殊成分对用户吸引程度高,找出改进的空间。

除了商品的维度,还可以分析商品的库存、供应链的管理以及送货快慢影响用户体验,决定是否增加储存仓。

品牌的忠诚度方面,可以知道什么收入阶层对什么商品感兴趣,用户年龄段,男孩还是女孩,根据这个推送相关产品,或者做关联销售。

京东在行业内拥有全价值链的大数据,数据链条是很完整的,数据质量很高。拥有自建物流,可以了解到送达到用户最后一公里的各类数据,通过不同的维度来分析。数据获取方面我们有优势。

04

中国芯片技术处于什么水平?中美差距有多大?

翁志:半导体的发展,美国从头到尾都参与,而且是领先的。芯片设计上美国还是走在最前面,他们有英特尔、Nvidia,高通、AMD等芯片大厂。但在制造工艺上,美国不是独占鳌头,亚洲已经非常领先,三星和台积电的制成技术甚至比美国还强。未来的市场亚洲并没有落后,但中国在半导体行业制造水平上还没达到这种水准。中国最好的就是华为的海思、紫光的展讯。

移动端芯片方面,海思也进步到一流水平,进入5G时代中国缩小差距了与美国的差距,只是还不能达到领先。

芯片积累非常重要,它需要一个过程,目前中国还没有一个世界领先的芯片大厂。

05

国内也有很多AI芯片厂商,比如寒武纪、地平线,你怎么看?

翁志:

我们做一个细分领域的AI芯片不难,但要做一个通用化的AI芯片还是很难的。我个人认为地平线和寒武纪还需要一个很艰辛的发展历程,初创公司人力财力有限,不可能铺得非常广。

06

京东有没有研发芯片的规划?

翁志:

我相信也会有一系列的行动、举措跟踪这方面,但现在还不是很方便透露。

我们做过inference端用于OCR领域的FPGA实现,提供API服务满足需求,也有团队尝试过CPU定制化的历程,对于技术的探索我们从未停止。

07

谷歌IO大会上推出TPU3.0,有人说它能够与英伟达GPU对标,您怎么看?

翁志:

谷歌Brain在出第一版本TenserFlow的时候就有跟硬件合作,那时候是TPU1.0版本,他们设计的时候会把软硬件有机结合,知道什么方面的算力需要放到硬件是最有效的。它的TenserFlow做了很多优化,很多工作由硬件完成能够使能效最高。

我感觉谷歌应该不会售卖TPU3.0,而是通过云的方式来输出。要想使它的TPU,就要用它的云。

08

京东的无界零售,未来规划是要做成什么样?

翁志:

无界零售就是线上线下数据有机融合,供应链一体化。把线上电商的技术优势带到线下门店来,包括非结构化数据的转化的能力,供应链的集成,物流配送体系的结合。线下店可以得到线上的效率,服务更到位,用户对商品的需求可以通过超越时空的方式满足。商户、用户、商店各种场景有机结合。

京东的无界零售就是重新定义人、货、场,达到效率、成本和用户体验有机结合。这是一个新生事物,有一个摸索过程,有失败也会有成功,它不会是坦途,是一个经验的积累,需要一定的时间,不断尝试。

从客户、商家,to B到to C全面来布局。成立专门从事无界零售的事业部,调动整个体系来做连接,以及投资的方式来布局。布局非常广泛。IOT也是其中一个方面。

09

商汤、旷视也在切新零售,和京东相比AI创业公司做新零售的优势和弊端有哪些?

翁志:

商汤、旷视是技术公司,他们切入更多是对人脸识别、场景识别等领域。他们更多的是通过合作获取数据。很难自己独立完成这件事情,更多的是和各种电商线下店一块合作做。对我们来说,电商本身就拥有很多应用场景。

现在技术和算法彼此差距都不是很大,体现出差距的地方是在数据。获取数据的能力在这方面决定了对公司的未来成功与否,技术公司必须与场景结合才能有获取数据的能力。

这些数据的能力又可以反哺使其技术得到升华,数据的获取能力决定了技术的深度。大家都看到了这是问题症结所在。

10

在AI这波浪潮,很多公司是非常激进的,尤其是百度全面押宝于人工智能,但京东相对来说节奏更慢一些,为什么呢?

翁志:

其实京东的人工智能的应用并不慢,我们在脚踏实地的将我们的业务场景去实现。并且在人工智能学术领域的研究也在稳步的探索,并将研究成果在京东丰富的业务场景中得到实践。在京东内部有太多应用场景,AI的渗透可以说是各个方面的,从我们的无人仓、无人车、无人门店、智慧供应链等等,每一个业务场景都有着我们AI的助力。而AI的应用就是随着这些业务场景的不断积累,最终产生质变的。

百度的投入很大,大力在推动阿波罗计划。这些公司都看到AI的方向和潜在价值,包括谷歌、微软都在调整重心。这个行业会越来越热,但会是一个漫长的征途,不会在两三年内有一个翻天覆地的变化,它还是一个渐进式的过程。大家还是把人工智能看得非常触手可及,在很多方面还需要更多的耐心。

相关阅读

推荐阅读

北京:新机场高速路计划明年上半年建成南五环至机场仅需20多分钟

北京:新机场高速路计划明年上半年建成南五环至机

原标题:新机场高速路计划明年上半年建成北京大兴国际机场高速公路建设完成超七成摄影 本报记者 黄亮北京青年报记者昨日从北京市交通委了 更多

2018-11-22 10:10:04
税总出台26条措施力助民企发展

税总出台26条措施力助民企发展

为深入贯彻落实习近平总书记在民营企业座谈会上的重要讲话精神,切实发挥税收支持和服务民营经济发展的职能作用,近日,国家税务总局印发《 更多

2018-11-20 10:10:00
两连阳为啥还没回本?买入绩优、白马、中大盘股才能轻松获利

两连阳为啥还没回本?买入绩优、白马、中大盘股才

一、大盘点评展望周二沪深两市小幅低开后,沪深300权重带动指数震荡上行。最终沪指上涨0 53%报收3410点,K线上收出一根中阳线;深成指上涨1 更多

2017-11-22 16:17:00
2017百度世界大会李彦宏透露无人车2018年量产 无人驾驶概念股备受期待

2017百度世界大会李彦宏透露无人车2018年量产 无

一年一度的百度世界大会11月16日在北京举行,每年的百度世界大会,百度创始人李彦宏都会带来他对过去,现在和未来关于互联网和整个IT领域的 更多

2017-11-16 11:17:37
百度世界大会今日召开聚焦智能硬件 百度世界大会受益概念股一览

百度世界大会今日召开聚焦智能硬件 百度世界大会

据怀新资讯报道,2017百度世界大会将于16日在北京举行。从邀请函上出现的神秘的盒子推测,本次百度将会有AI硬件以及诸多AI新技术发布。从今 更多

2017-11-16 10:17:03
MSCI中国A股指数大调整 msci中国a股指数成分股名单一览

MSCI中国A股指数大调整 msci中国a股指数成分股名

11月13日晚,明晟公司(MSCI)在半年一度的指数评估中,公布了对MSCI中国A股指数、MSCI中国全部股票指数的最新重大调整。公告显示,MSCI中 更多

2017-11-15 14:43:49
风云三号D星凌晨成功发射 风云三号d星概念受益股有哪些?

风云三号D星凌晨成功发射 风云三号d星概念受益股

今天凌晨,长征四号丙运载火箭发射风云三号D星。中国航天科技集团供图新京报快讯(记者倪伟)今天(11月15日)2时35分,我国风云三号D星在 更多

2017-11-15 09:26:44
1953年三元纸币价格表 第二套人民币的发行具有怎样的纪念意义

1953年三元纸币价格表 第二套人民币的发行具有怎

【藏品名称】第二套人民币53年叁圆井冈山【藏品类别】人民币单张【发行时间】1955年3月1日【停用时间】1964年5月15日【发行量】限量【面值 更多

2017-11-14 16:24:17
+ 点击查看更多精彩
31省份今年GDP目标全出炉 推动高质量发展成聚焦点
    随着山东省两会的召开,目前31省份2019年政府工作报告全部出炉,...
基金子公司资管规模2年降幅近50%
    中国证券投资基金业协会日前发布数据显示,截至2018年底,证券期...
11地楼市探路一城一策 房地产调控最严时期已过?
    资料图:楼市。孙睿 摄门槛微调 11地楼市探路一城一策青岛、菏...
阿里全球数学大赛决赛开战 难度堪比博士入学考试
    近日,阿里巴巴全球数学大赛决赛开战,全球11个国家300多位数学高...
北京:新机场高速路计划明年上半年建成南五环至机场仅需20多分钟
    原标题:新机场高速路计划明年上半年建成北京大兴国际机场高速公...
IEEE HotlCN 2018:成就区块链未来的是需求,而非技术本身
    8月14日,由北京大学深圳研究生院、深圳众享互联科技有限公司以及...