构建人工智能系统太难?Facebook 让机器自行构建人工智能系统
构建人工智能系统太难了,于是 Faceook 开发了一个人工智能系统自己构建人工智能。
深度神经网络正在重塑互联网。这样的人工智能系统因为有了通过分析海量数据学习每样人类任务的能力,从而为网络在线服务注入了以前无法实现的新力量。它们能在照片中识别人脸、识别智能手机的语音指令、还能进行机器翻译。它们甚至在帮助谷歌选择搜索结果。这些我们都知道,但往往较少提及的是互联网巨头们如何去建造这些相当了不起的人工智能引擎。
其中一个做法是,谷歌和Facebook这样的公司花高价聘请那些顶级聪明的人。地球上只有几百人有这样的天赋和技能来真正推动人工智能事业的发展。在这些顶级大脑上的投入抵得上一个 NFL(美国橄榄球联盟) 四分卫的工资。这是人工智能不断发展进步的一个瓶颈,而且这并不是唯一一个瓶颈。即使是顶尖的研究者们,在没有大规模反复试验的情况下,也无法建立这样的人工智能服务。要构建一个解决人工智能难题的深度神经网络,研究人员在成功前一定会尝试无数种方式,并一个一个的在几十、几百个机器上运行。
Google 旗下 DeepMind 公司的联合创始人Demis Hassabis 说,「这更像是做教练而不是球员,你忽悠着把这些东西传达出来,而不是直接告诉机器做什么。」
这就是为什么许多公司现在正试图把反复试验(trial and error)的过程自动化,或至少使其一部分自动化。如果你把核心关键自动化了,你可以更快速地将最新的机器学习推广到普通工程师手中,顶级天才将会有更多的时间思考更好的想法、解决更困难的问题。反过来,这也会加速我们日常使用的网络服务和 App 背后的人工智能的进程。
换句话说,要让计算机变得更聪明、更快,电脑本身必须处理更繁重的工作。互联网巨头们正在制造能够替代工程师测试无数机器学习算法的计算系统,并且这种系统自身能够不断测试各种可能性。更好的是,这些公司正在开发可以帮助建立人工智能算法的人工智能算法。这并非开玩笑。在Facebook内部,工程师们已经设计一个他们称之为「自动机器学习工程师」的人工智能系统,一个帮助开发人工智能系统的系统。虽然离完美还有很大距离,但最终目标是用尽可能少的人力工作创造新的人工智能模型。
感受下 Flow
在 Facebook 2012 年 1040 亿美元的 IPO 之后,Facebook 广告团队的 Hussein Mehanna 和其他工程师在改良公司的广告定位上倍感压力,因为它们需要更精确地把广告和数以百万计使用社交网络的用户匹配起来。这意味着构建的深度神经网络和其他机器学习算法需要更好地利用 Facebook 收集到的大量数据。这些数据来源于数以百万计的用户的特性和行为爱好。
据 Mehanna 所说,Facebook 工程师们在想出新的人工智能点子上毫无压力,但测试这些想法却又是另一回事。于是他和他的团队开发了一个叫做 Flow 的工具。Mehanna 说,「我们想建立一个机器学习装配线,让 Facebook 所有的工程师都可以使用。」设计 Flow 的目的是帮助工程师大规模的开发、测试和执行机器学习算法。这是一个广泛的技术,涵盖了完成自我学习任务的所需的所有服务,也几乎包括了任何形式的机器学习技术。
基本来说,工程师们可以很容易地测试公司庞大的计算机数据中心网络层出不穷的想法。他们可以运行测试各种算法的可能性,这些算法所涉及的不只是深度学习,还有其他形式的人工智能,包括对数几率回归到 Boosted 决策树,而测试的结果还可以提供更多的想法。Mehanna 说,「尝试越多的点子、越多的数据就越好。」这也意味着工程师们可以很容易地对其他人写的算法进行再利用,对这些算法进行微调然后应用到其他任务。
很快,Mehanna和他的团队在全公司推广使用 Flow。在其他团队里,它可以帮助生成各种算法:选择 Facebook News Feed 的连接、识别发布到社交网络照片里的面孔、为照片生成音频描述从而让盲人理解照片内容。它甚至可以帮助公司确定世界的哪些部分还需要接通互联网。
Mehanna 说,在 Flow 的帮助下,Facebook 每个月训练和测试约 30 万个机器学习模型。曾经 Facebook 每 60 天左右才把一个新的人工智能模型推送到其社交网络上,而现在每周就可以推送几个新的模型。
下一个前沿
这个想法要比 Facebook 本身重要的多。这是全球深度学习领域共同的实践。去年,Twitter 收购了一个叫做 Whetlab的创业公司,专门从事这样的工作。最近,微软也透露出其研究人员如何使用一个系统测试海量的人工智能模型。微软研究人员 Jian Sun 把它称之为「人类辅助搜索。」
Mehanna 和 Facebook 想要加快这个进程。公司计划最终把 Flow 开源,与世界分享 Flow。据 Mehanna 所言,诸如LinkedIn、Uber 和 Twitter 都对使用 Flow 感兴趣。Mehanna 和他的团队还开发了一个工具叫 AutoML,可以减去工程师们更多的负担。与 Flow 同时运行的 AutoML 可以在没有任何人为干预的情况下,自动「清除」用来训练神经网络的和其他的机器学习算法的数据,并做好测试准备。Mehanna 设想的未来版本甚至可以收集自己的数据。但更有趣的是,AutoML 使用人工智能帮助开发人工智能。
正如 Mehana 所说,Facebook 每个月训练和测试约30 万个机器学习模型。AutoML 可以使用这些测试结果来开发另一个机器学习模型,这个模型可以优化整个机器学习模型的开发流程。是的,这可能让你感到困惑。Mehana 把它与《盗梦空间》相比,但它是行得通的。该系统可以自动选择行得通的算法和参数。「这几乎可以在开发前就能预测到结果,」Mehana 如是说。
在 Facebook 的广告团队里,工程师们甚至还开发了叫做 ASIMO 的「自动机器学习工程师」,这个工具已经推广到公司的其他部门。据 Facebook 表示,在有些情况下,它可以自动增强和改进现有模型,工程师可以把改进后的模型立即应用到网络里。Mehanna 说,「它还不足以发明一种新的人工智能算法,但沿着这条路一直走下去谁又知道会怎样。」
这确实是一个很有趣的想法,一个让科幻作家为之痴迷几十年的想法:一个会自我建造的智能机器。其实 ASIMO 并没那么先进,但这确实是走向未来世界一大步。在未来,开发人工智能的人里面,不仅会有绝顶聪明的天才,还会有一些非人类的存在。
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新