发展至今的机器学习到底对我们的就业和社会产生了哪些影响?
本文基于大量的报告资料,揭示了机器学习对于就业和社会的具体影响。
本文编译自《science》杂志中的一篇长文“What can machine learning do? Workforce implications”,作者为MIT教授、美国经济研究局研究员Erik Brynjolfsson和卡内基梅隆大学教授Tom Mitchell,本文的参考资料多达23篇。
以下为正文:
在过去几十年里,计算机已经改变了几乎所有的经济运作。现在,因为机器学习(Machine Learning)的兴起,自动化的程度和速度有了迅猛的增长。就像当年的蒸汽机和电力的诞生一样,机器学习也是一种带来巨大生产力的革命性技术。但是目前,在对于机器学习在应用领域上的潜力,我们还没有完全认识,也无法达成共识。因此,在当前这一阶段,人们唯一的共识就是机器学习将会对生产力和经济产生巨大的影响。
本文,我们借鉴了与机器学习系统相关的报告资料,以探讨我们所能够看见的这一技术对生产力产生的关键性影响。我们发现,有些工作是适合用机器学习系统替代来做的,有些工作采用机器学习是不适合的。因此,在讨论机器学习对就业的影响时,就不是替代人类或是无法替代人类这么极端而简单的问题了。虽然,目前机器学习对经济的影响还是有限的,我们也并没有像宣称的那样面临失业,但其对于未来的经济和劳动力的影响还是很深远的。
MIT数字经济学教授、美国经济研究局研究员Erik Brynjolfsson
我们需要认识到的是,创新对价值的创造和生活水平的提高都起到关键作用,所以机器学习诞生以来的信息技术系统就为人们创造了第一波价值(数万亿美元),对此,在美国国家科学、工程和医学科学委员会提交的一份报告中就指出了其影响力“技术的进步导致了严重的工资不平等”。其实,因为技术的进度而带来的不平等还有很多,如在经济全球化和近十年来技术巨变的双项因素下,未来经济的影响将会具有高度破坏性,这也就意味着,即便你是赢家,赚了很多钱,但因为经济危机受牵连,你依然是失败者。而这一问题,就需要制定政策的政府领导、商业领袖、技术人员和研究学者的高度重视。
不过尽管机器学习正在为我们带来很多不良的影响,在谈论机器学习可以做什么,不可以做什么之前,我们仍需明确这两点:1.离机器取代人类还有很长时间;2.机器不可能完全取代人类。
从价值层面来看,当机器执行特定的作业或者某一部分任务时,剩下的非机器学习可以完成的任务就会变得更有价值。另一方面,机器将会增加人的生产力,使全新的产品、服务和工作流程的产生变为可能。因此,在对劳动力需求的影响上,即便是对那种需要机器的工作岗位,机器学习带来的影响可能是消极的,也可能是积极的。当机器学习系统接近于某些岗位的人类的能力时,作为这些系统的补充的职位就会出现。而当机器学习系统比人类更具成本效益时,企业家或商人就自然会采用机器来取代人类,以达到利润最大化。进而,这样将会提高生产力、降低价格、转移劳动力需求并重组整个行业。
卡内基梅隆大学深度学习领域教授Tom Mitchell
大数据等因素促进了机器学习的蓬勃
哲学家 Polanyi说过:We know more than we can tell.人脸识别、骑自行车这个动作和对自然语言的理解是人类天生具备的能力,但是我们却不知道我们自己是如何做到和学习的,有一个很大的原因在于我们没有办法轻松的处理一大堆数据并从中发现规律。因此,在机器学习时代到来之前,我们是很难通过计算机完成这么巨大的任务的。但今天,机器学习的算法已经使计算机系统训练过程比手动编程更有效。
近几年,写一段特定功能的程序都需要很多程序员来参与编写,但逐渐,因为机器学习算法(神经网络)的存在,写程序也可以变成自动化过程,我们只要不断的给数据对其进行训练即可,无需再做大量的编程工作。
机器学习算法为编程领域带来了两项影响,一是通过对神经网络的训练就可以得到比程序员编程编出的程序更精确的算法(如人脸识别);二,这种模式大大降低了创建和维护新软件的成本。
过去6到8年间,机器学习的发展十分迅速,很大程度上是因为我们拥有关于某项领域的大量的数据,通过对这些数据进行训练和分析,我们会发现很多此前没有发现的规律和价值,或者换句话说,是机器学习通过其类似于人的分析能力让我们看见了数据的潜在价值。当我们有足够多的数据时,机器学习就可以很好的完成我们的任务要求。
当然,除了大数据,其他很多方面的发展也是促进机器学习发展的关键因素,如毫米波的改进、深度神经网络(DNN)的出现和计算机硬件的发展。如现在,Facebook每天将超过45亿的短语翻译模式转换到DNN模式;同时DNN也用于ImageNet中的图像识别等;此外,因为DNN的运用,其语音识别的错误率已经从2010年的30%降低到2016年的3%。值得指出的是,图像识别和语音识别的错误率阈值是5%,因为这是人类犯错的概率值。
新型自动化模式:学习
但是要用机器学习来完成一项任务或者解决一个问题,我们必须让机器弄明白这项任务的要求,即性能指标。目前在实际应用中,大多数学习都是指向目标函数的,即目标的输入应对应于特定的输出数据。如自动驾驶车辆传感器测试到的输入数据应该直接指向下一个对应的输出指令。
但是在某些领域,想要获得贴近于事实的输出(目标函数)是很困难的事情,如精神病的诊断、人力资源决策方面和处理法律案件,因为它们没有固定的输出模式。
所以想要成功的将机器学习商业化,其关键步骤是:明确机器学习的任务;能够收集到用于训练的高质量数据;数据能够为工程师所用并有助于预测目标输出;能够收集到新的数据以弥补原始数据的不足;要尝试不同的算法和参数设置,以优化学习分类器的准确性;最后将其嵌入到日常应用中,从而提高生产力。
由机器学习发展而来的一种未来自动化模式就是“学习人类”,其中人工智能(AI)就是通过模仿和学习人类的很多行为来实现这种最新的自动化模式的,这也导致了新的商业模式。
八项判别准则,揭示机器学习的特征
尽管目前的机器学习系统的能力让人惊艳,但是它们并不是适用于所有的任务。现有的机器学习的能力很大程度上取决于深度神经网络。在有些方面,它们确实比人都要厉害,但是它们的决策能力比人的能力要弱太多。当然,机器学习系统还在进步中,后面可能适用于更多的工作。基于目前的发展情况来看,我们给出了8个关键的判别标准,以此可以区别某一项任务适不适合利用机器学习系统去做。
1.明确的输入必须映射到明确的输出,以构成明确的函数
这一准则也适用于分类(如根据品种来标记狗的照片)和预测(如通过分析贷款申请来预测未来缺省的情况)。不过虽然机器学习系统可以根据统计意义上的相关性来预测与输入(X)有最大关联的输出(Y),但是它可能无法学习到如何判断因果关系。
2.大数据中必须存在成输入-输出关系的数据对
根据系统的需求,想要有效的训练深度神经网络,提高其准确度,越多的数据对越好。尽管深度神经网络就像一个“黑盒子”,原则上可以表征任意函数,但是计算机很容易模仿并不断训练存在偏差的函数,这样就不利于找出数据的规律。所以这就需要专人来对数据进行明确的标记和梳理。
3.这项任务有明确的目标和参数来对学习的效果进行明确的反馈
虽然通过机器学习不是总能很好的得到目标输出,但是至少机器学习系统可以很好的描述我们想要的目标输出。这就像早期的自动化系统,它们可以通过输入输出来模仿任务,但可能不会是最佳的逼近实际系统。因此,明确一个衡量系统性能的指标是一条黄金准则。依据这条准则,系统在训练过程就会不断自我修正,从而达到最佳的性能表现。
4.无需很长的逻辑和推理链
机器学习系统非常善于分析数据的关联性,但是一旦逻辑链过长,后面的学习效率就会降低。但是像Alpha Go这样的非物理类的游戏,因为可以自动收集数百万个典型训练数据案例,所以可以很好的模拟。但在现实世界中,我们就很难做到这样完美的模拟。
5.我们不知道也无需知道系统是怎样做出这样的决定的
大型的神经网络可以通过数以万计的数字权重来做出最后的抉择,这些数字权重就是人造神经元。但是其中的逻辑还是很难解释的,目前对于这方面的研究也比较缺乏。
6.任务的容错能力较强,无需最佳的解决方案
几乎所有的机器学习算法都是基于统计概率来给出最后的输出的,因此很难将其训练到100%的准确度。即便是人,也会犯错。
7.所学的功能不会随着时间的推移而快速变化
通常来说,当需要处理的数据和训练的数据分布是类似的结构时,机器学习算法才能很好地工作。如果新的数据分布发生变化,系统就需要重新训练。
8.缺乏灵活性、物理上的操作和移动能力
在处理非结构化环境和任务中的物理操作时,机器人和人类相比仍然很笨。这不是机器学习的缺点,而是现有机械技术的缺陷。
机器学习到底适用于哪些性质的工作?
此前,机器学习对于就业的影响主要在一些结构化和重复性的工作上。但是未来,其他很多工作将会被机器取代,那么我们如何辨认出这些工作呢。
一项工作通常包含许多不同但相互关联的分工。在大多数情况下,这些分工中总有部分适用于机器学习,比如,我们可以通过训练一个机器学习系统来帮助律师对案件的潜在相关文件进行分类,但是当面对潜在证人或者想办法让证人提供有效证词时,机器学习就完全失去了作用;类似的,机器学习系统可以用于阅读医学影像,但与其他医生的交流,包括与患者的交流,这些都是非结构化的任务,不适合采用机器学习系统。
但这不代表,所有需要交流的任务机器学习系统都无法胜任,比如销售人员与客户之间的很多聊天内容和任务,聊天机器人都可以胜任;还有视频中人脸面部的一些情绪表现,机器学习系统也可以识别出。
除了上面提到的情形,对于机器在创造性任务上的表现,我们的认识也需改观。传统意义上,机器是按照人们设定好的方式来一步一步完成任务的,没有任何“创造性”空间。但是机器学习系统是专门为找出解决办法而设计的系统,我们对其的设定只是目标和参数,没有明确规定该怎么去解决。举例来看,以前人类设计复杂设备的能力远远超过机器和计算机,但是现在根据要求,利用机器学习系统生成的设计比任何人设计的都好。
从机器学习的层面来看,这又不是“创意”,因为能不能设计出好的设备完全取决于人们在最初设定的参数。所以未来,这种看似是创造性的工作将会被机器学习取代,而同时更为重要的是人们在选择参数和设定目标的能力上。这也就意味着,无论是科学家,还是企业家,能够准确描述出问题这一能力将变得越来越重要。
从六项经济因素看机器学习对社会的影响
有许多非技术因素会反映机器学习对于就业的影响,换句话说,机器学习对于就业的整体影响可以转化为六项经济因素。
1.代换
融入机器学习的计算机系统将会直接取代部分人力,并减少产出部分的劳动力需求。
2.价格弹性
通过机器学习实现的自动化生产将会导致完成一项任务的成本降低,但总的消耗增加或减少取决于需求的价格弹性因素。如果弹性小于-1,则价格下降导致购买数量的增加,那么整个成本就会增加。如1903年以后,由于技术降低了航空的价格,需求就增加了,在航空方面所花费的反而增多,就业也自然变多。
3.互补性
工作A是自动化的工种,而非自动化的任务B对A来说又是不可或缺的,那么随着A的成本降低,对B的需求自然会增加。类比来看,随着计算机的普及,程序员的需求不断增加;人际交往能力和分析能力之间也是一种互补。
4.收入弹性
自动化的程度是可以改变社会的总收入的。如果一个商品的收入弹性不为零,这又会改变对某些商品类型的需求以及生产这些商品所需工作的派生需求。类比来看,随着总收入的增加,美国人已经把更多的收入用于餐饮。
5.劳动力供给的弹性
随着工资的变化,从事某项工作的人们会给出一定反馈。如果有许多人具备了该必要的技能,那么供给就会有弹性,即使需求会增加(下降)很多,工资也不会上涨(下降)很多。相反,如果这项技能很难修炼,比如成为数学家,那么需求的变化将主要体现在工资而不是就业上。
6.业务流程重新设计
给定的劳动力的数量和类型不同、资本和其他投入、产出不同,与之相关的生产函数也是不同的。所以其中任何一项因素改变,管理人员就要重新建造相关流程。而新技术会改变生产过程,所以他们需要找出最有效的方式和生产流程。这些变化会需要一段时间,但它往往能够节省成本和投入,增加需求弹性。随着时间的推移,个人可以通过学习新技能或换新工作,来表示对于高工资的认可和回应,这样会增加相关的供给弹性。
因此,根据Le Chatelier准则,随着固定因素的调整,长期来看,供需弹性比短期更大。由于生产流程、组织设计、商业模式、供应链、法律约束甚至文化期望都需要改变,所以一项技术的采用和推广往往需要几年或几十年的时间。因此为了加快技术的推广,往往我们需要在社会方面也采取一定的措施。
随着时间的推移,新的产品、服务、分工和工作流程被创造出,从而致使新的工作产生。从历史层面来看,随着一些工作任务趋于自动化,释放的劳动力已经重新部署到生产新的商品上。这种创新比增加资本、劳动力或资源投入更能提高人们的整体收入和生活水平。
结语
机器学习发展到最终,其范围和规模可能会超过电力技术。该技术带来的进步不仅直接提高了生产力,而且更重要的是,引发了机器、商业组织乃至整个经济的互补性创新浪潮。未来,在技能、资源和基础设施等方面做出正确的互补性投资的个人、企业和社会将会得到蓬勃发展,而另一些没有参与进来的人,在某些情况下将会更糟糕。因此,更好的理解机器学习的具体适用场景和工作任务,对于理解其对经济的影响也是至关重要。
原文链接:http://science.sciencemag.org/content/358/6370/1530.full
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新