谷歌Waymo与DeepMind合作,开发出新训练方法提高自动驾驶训练质量和效率
两家公司最终希望训练出一个能够保持99%以上的总体障碍物识别率,并且减少误报的AI模型。
Alphabet旗下的两家公司终于合作了。
日前据媒体报道,Alphabet旗下的Waymo公司和DeepMind公司进行了合作,他们开发出一种模拟进化论的新训练方法,以此提高训效率和质量。
首先要知道一个AI算法模型是通过成千上万次的实验来自我改进的。通常工程师会给一个模型制定一个任务,模型通过多次实验以及收到的反馈来进行调整,然后学习并执行任务。执行任务的表现主要依赖于训练方案,因此对于研究人员和工程师来说,寻找最合适的训练方案是其主要工作。他们会精心挑选接受培训的AI模型,将表现差的模型剔除并释放资源,然后从零开始训练新算法,这需要消耗研究人员和工程师的大量精力与时间。
据悉DeepMind基于PBT(基于人口的训练)中设计出了一种劳动密集度低的方法,该法法从随机变量生成的多个机器学习模型开始。模型会被定期评估,多个机器学习模型之间则会以进化的方式互相竞争,表现不佳的模型会被“进化”更好的、表现更好的模型副本取代,这个副本则被称为“后代”。每个后代会继承父网络的状态,因此PBT也就不需要从零开始重新训练,而整个训练过程中,后代将会积极更新超参数。基于此,最终PBT可以将其大量的资源用来训练“好的”超参数值。
不过PBT也并不完美,这种方法侧重于短期、当前的优化,但并不是从长期出发,因此不利于后期发展的AI模型。为了解决这种情况,DeepMind的研究人员又培育了大量模型(人口),并创建名为“利基”的子人口,算法只会和其自己子群中的模型竞争。
目前,DeepMind和Waymo已经将PBT应用到AI对行人、自行车和摩托车的识别任务,希望以此来检验算法是否能够得到进一步提升。对于测试结果,Waymo表示PBT算法的精度更好,与手工调整的等效物相比,误报率能够减少24%,并且识别率仍然能够维持比较高的水平,此外该算法还能够节省时间和资源。Waymo称,已经将PBT纳入了Waymo的技术基础架构,公司的研究人员可以通过点击按钮来应用该算法。
两家公司最终希望训练出一个能够保持99%以上的总体障碍物识别率,并且减少误报的AI模型。
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新