吴恩达谈深度学习局限:AI 经济价值目前仅来自监督学习

镁客 8年前 (2016-05-25)

《财富》刊登吴恩达专访,吴恩达介绍了百度内部深度学习平台等人工智能应用。

《财富》近日刊登吴恩达专访,吴恩达介绍了百度内部深度学习平台等人工智能应用。吴恩达还指出,近年来 AI 发展主要得益于数据(燃料)和计算力(引擎)的发展,眼下数据比计算力发展稍快(给引擎的燃料还够),但硬件发展日益加快,在某些领域甚至超过了数据(给引擎的燃料不够),要努力保持两者同步发展 AI 才能继续往前。

吴恩达谈深度学习局限:AI 经济价值目前仅来自监督学习

2016 年 5 月 23 日,《财富》网站刊登了对吴恩达在加州森尼韦尔的百度人工智能实验室接受了《财富》杂志的专访,他谈了几个问题:(1)为什么现在人工智能这么火;(2)企业是如何利用人工智能来赚钱;(3)为什么人工智能灭世论严重夸大。

目前 AI 创造的经济价值几乎全部来自监督学习

Fortune:你将如何定义人工智能,或者说商业上可行的人工智能?

吴恩达:我们在过去几年中看到,计算机在处理数据以进行预测这方面做得越来越好了。这既包括预测用户最有可能点击什么样的广告,也包括在图片中识别出人、预测哪些网页最符合你的搜索查询需求——以及数百个其他的诸如此类的例子。许多这样的应用可以让用户的数字体验变得更美好,而有些时候这些改变也提高了企业的技术最低门槛。

Fortune:是否可以说,目前主流的人工智能主要关心从数据中识别出模式,而不太关心建造出能像人类一样思考的计算机?

吴恩达:尽管人工智能常常被过度宣传,我仍认为人工智能的进展程度已远远超出了许多人的想象。目前,几乎所有由人工智能创造的经济价值都来自监督学习技术。监督学习的意思是,基于系统曾经接受过的其他实例的输入,来学习对结果进行预测或对东西进行分类。这些任务可以是:“给你一幅图片,请把那个人从图里找出来”,“给你一个网页,请预测用户是否会点击这个网页”或者“给你一封电子邮件,请判断它是否是垃圾邮件。”

语音识别是这方面的另一个例子,在语音识别中输入的是音频剪辑,而输出是音频内容转换成的文本。

机器学习这几年之间发生了什么

Fortune:由于苹果 Siri 提供的新功能,语音识别最近比较火。下一步怎样才能让智能助理型的应用更加有用呢?

吴恩达:我们想要追求的目标是,让与计算机交谈变得像与人交谈一样自然。这是一个远期目标,我们短期内不能实现它,但当我们实现这个目标后,就会有更多的用户想使用它。目前,很大程度上只是一些技术热衷者在使用语音功能。世界上的大部分人并不使用语音来与电脑互动。

与机器交谈的感觉仍然和与人交谈的感觉非常不同:你只能够交谈某些方面的东西,你不能在交谈中打断机器人。有些时候,机器人的回应会比较慢。有些时候,你说的东西会令机器非常困惑。比方说,如果我对计算机说,“请打电话给卡洛,号码 555-1000……不,等等,1005”,计算机就很难理解我的话,也很难采取正确的行动。

Fortune:几年之前,没有几家人工智能是面向消费者的,而今天像语音识别和能理解照片的算法这样的技术已很普遍。这几年之间发生了什么?

吴恩达:机器学习方面的大量进展是由计算能力的提高和数据的增长所驱动的——不过我这个观点在学界可能不太受欢迎。我们可以把它类比于建造太空火箭:你需要大功率火箭发动机,你也需要大量的燃料。如果你有许多燃料但只拥有小功率发动机,你的火箭大概无法飞离地面。如果你拥有大功率发动机但只有一点点燃料,你的火箭即使飞上天也无法进入轨道。

只有当你同时具有了大功率发动机和大量燃料时你才能去探索太空中的奇妙之地。作为类比,大型电脑相当于火箭发动机(在百度我们已经可以建造超级电脑了),而大规模数据则相当于火箭燃料。

在过去十年中,数据的增长或者说火箭燃料的增长略微超出了我们建造火箭发动机以利用燃料的能力。不过目前,我们在扩增火箭发动机方面的能力已经追了上来,在有些时候甚至反过来超过了我们提供火箭燃料的能力。我们必须努力工作才能同时扩展这两种能力。

Fortune:好像现在每当深度学习被应用于某个任务时,它都能为那个任务产生最佳结果。我们是否也能够把深度学习应用于企业销售数据,从而比传统企业软件或流行的“大数据”工具更快地找到有意义的商业洞见?

吴恩达:深度学习的一大局限是,它所创造的几乎所有价值都来自“从输入到输出的映射”的方法。比方说你有一些企业数据,其中 X 或许是用户在亚马逊上的帐号,而 Y 是“用户是否进行了购物?”这样一个问题。如果你拥有关于 X-Y 配对的大量数据,那么你就能够利用深度学习来进行预测。然而,如果让电脑自己在数据中进行探索和发现,这方面的算法在很大程度上尚处于摇篮期。

正因为如此,那些关于人工智能邪恶杀人机器人和超级智能的宣传都是严重夸大的。上面提到的 “从 X 到 Y 的映射”只是一种很狭窄的学习方式。而人类可以以多得多的方式来学习。这种“从 X 到 Y 的映射”方法在技术上被称为监督学习。我认为,关于监督学习之外的其他学习方式,我们仍然没有找到正确的思路。

中国市场上的人工智能

Fortune:在美国谷歌和 Facebook 的工作引人瞩目。能否告诉我们,百度用人工智能做了些什么?

吴恩达:百度有一件事情做的很不错,它创造了一个机器学习内部平台。这个平台能够让全公司的工程师、包括那些不研究人工智能的人都能以各种创造性的方式来利用深度学习——他们会用深度学习创造出一些像我这样的人工智能研究者从未想到过的东西。除了我们核心的网络搜索、图像搜索和广告业务外,深度学习还支持着大量的创意产品,这些创意产品构成一条非常长的长尾。

例如,我们的电脑安全产品使用深度学习来识别安全威胁。我从未想过深度学习可以做这个,也不知道该怎么做。我们也使用深度学习来提前预测一个硬盘何时会崩溃,而这就既增加了系统的可靠性,也降低了数据中心的成本。

Fortune:百度也制造了类似谷歌眼镜的产品,还制造了数字助理,甚至智能自行车。这些产品有市场吗?还是说它们目前只是一些有趣的实验而已?

吴恩达:我认为这些目前还属于研究性探索。不过,通过我们从社区中获得的反馈,我们了解到对智能自行车和可穿戴摄像机的需求是确实存在的。

实际上几周之前,我们刚刚在中国发布一个名叫 Dulife 的新产品的 demo,该产品使用计算视觉和自然语言处理技术来告诉盲人其面前有什么东西。比方说,在中国,有好几种面值不同的钞票大小相同,而盲人必须通过触摸才能知道它们哪里不一样。然而,当钞票被反复使用后,它的盲文部分会磨损,这样盲人就很难辨别其面值。在这种情境中,计算机视觉可以告诉盲人,这是一张 20 元的纸币,还是一张 50 元的纸币。这种产品是盲人十分需要的。

Fortune:在这些移动和可穿戴设备方面,中国市场是否与美国市场以及其他市场有什么不同呢?

吴恩达:中国市场非常不一样。其中一个差异是,中国目前最大、最热的技术趋势是 O2O,即从线上到线下。O2O 的概念指的是,用你的移动设备把你周围的外在服务连接起来,无论这些服务是洗车、送餐、寻找附近的打折电影、美甲还是雇佣私家厨师。在美国也有这些东西,不过中国巨大的人口密度使得 O2O 可以迅速成长。

还有,在中国许多用户的第一件计算性设备是智能手机。当你的第一件计算性设备是手机的时候,你就会学习用最有效的方式来使用手机做事,而不一定会改为使用电脑。

我们可能正在接近 AI 期望值的顶点

Fortune:什么时候我们会不再把人工智能当成新鲜事物来看待,而是像对待许多其他技术一样把它视为理所当然呢?

吴恩达:我想,就像在 Gartner 公司的技术成熟曲线(Gartner Hype Cycle)上,我们可能正在接近人工智能期望值的顶点。我认为,对人工智能超级智能的恐惧曾经达到过顶点,而如今这种恐惧的高潮已经过去了。很难讲,或许我是错的,但我希望的是这样一个未来:到那时,我们将不再夸大人工智能,而是集中精力去探索人工智能的进步。

吴恩达谈深度学习局限:AI 经济价值目前仅来自监督学习

Fortune:这么说,我们近期是不是还达不到这样的水平:我们的设备或应用程序能识别出我们或我们周围的东西,而我们对此能习以为常?

吴恩达:我认为,在计算视觉方面还要等很久,因为目前计算视觉的产品并不多。不过我可以分享一个盈利很好的计算视觉产品。

在百度的广告系统中,如果你向用户展示一段文本,这没问题。运用我们的深度学习技术,我们可以帮助广告商选择一个小图片,这个小图片可以与文本并列放置。这样,你不仅会读到一小段关于在巴厘岛度假的广告,还会看到一幅巴厘岛的小图片,而你只需要几分之一秒的时间就能理解它。这一服务能让用户更快地明白某个广告是关于什么的,它极大的促进了我们在沟通用户与广告商方面的能力。

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到