图森未来陈默:用计算机视觉技术加速自动驾驶落地

Joker 7年前 (2017-03-06)

相对于激光雷达解决方案来说,计算机视觉技术已经相对成熟,所以成本也就更低。

在不久的将来,整个汽车行业将被两个技术所颠覆,一个是车联网,另一个就是自动驾驶。当然,或许未来的某一天会实现无人驾驶,但是自动驾驶一定会先期到来。前段时间,镁客网采访了国内车联网领域的领跑者之一:飞驰镁物。而最近,则是采访到了国内自动驾驶领域中的领跑者之一:图森未来

图森未来陈默:用计算机视觉技术加速自动驾驶落地

计算机视觉起家的图森,转向自动驾驶是想让技术落地

其实在2015年成立之初,图森未来是一家专注于专注于计算机视觉算法研发的创新公司,在图像识别、人脸识别、智能驾驶、SLAM技术等领域拥有显著的技术优势,并根据企业级用户的需求定制算法和解决方案。

图森未来陈默:用计算机视觉技术加速自动驾驶落地

但是,现如今的图森未来却是一家做自动驾驶的企业,对于这样的一种转变,联合创始人&CEO陈默说道:“计算机视觉作为一种技术,有很多应用方向,比如VR、AR、无人机、自动驾驶等。对于图森来说,做自动驾驶不是很大的转变,而是给我们的技术找到一个合适的应用方向。在视觉技术应用到自动驾驶之前,自动驾驶的技术方案只有激光雷达一种,成本高,难以商业化。深度学习出现后,使得算法能力极大提高,计算机变得更聪明,并且GPU等算力也迅猛提高。我们知道,软件和半导体是按摩尔定律发展的,所以算法和算力一定是不断增长的,对应的视觉技术成本一定是不断下降的;与此同时,随着中国人口红利的消失和老龄化社会的到来,司机这一人力成本一定是上升趋势的,这会带来用工荒和运力危机,运输自动化也是必然趋势。”

图森未来陈默:用计算机视觉技术加速自动驾驶落地

全球自动驾驶领域中,使用计算机视觉和深度学习技术作为自动驾驶解决方案的公司中,最有名的要算是特斯拉了。但是,在对应的应用领域上,图森未来又和特斯拉有着不同之处,因为他们选择了另一个应用方向——可商业化的货运自动驾驶。

不过,无论是计算机识别还是自动驾驶,都并非CEO陈默的老本行。在创办图森未来之前,陈默已经是一个成功的连续创业者,但是他此前创办的3家公司并没有一个和计算机视觉技术、自动驾驶有关。而创业团队中的其他人,则是专注于计算机视觉技术,并且都算得上是行业中的技术大牛。那么,究竟是什么让他们选择一起创业呢?

图森未来陈默:用计算机视觉技术加速自动驾驶落地

图森未来北京团队

陈默是这么说的:“我觉得,最重要的一点是,团队都认同技术的应用方向——可商业化的货运自动驾驶。图森的团队中,技术人员占比约70%;我们的合伙人成员,除了我都是技术人员。像他们这样的技术人员,到这个领域的任何一家公司待遇都不会差。技术人员他们更多地是看重自己的技术能否真正应用到实际中,做出成绩。”

诚然,一个优秀的技术型人才在任何地方都会发光。但是,图森未来这种专注于让技术落地的发展思路,也能够让技术大牛们获得成就感。而且,他们真的做到了。

在计算机视觉自动驾驶领域,图森未来算得上全球顶尖

去年9月,图森未来研发的计算机视觉与深度学习算法在全球最权威、最具影响力的自动驾驶算法公开排行榜KITTI和Cityscapes评测数据集上,均获得世界第一。要知道,参加KITTI和Cityscapes评测的不乏百度、三星研究院、英伟达、UCSD、斯坦福、中科院等名企名校及科研机构。而且在这两种评测数据集上,图森未来拿到了10项世界第一。

图森未来陈默:用计算机视觉技术加速自动驾驶落地

不过,他们选择不再继续提交数据,是因为图森未来更加注重将采集到的数据真正应用到研发中去。“数据集本身不能说明全部”陈默说“自动驾驶不仅是感知一个层面的事情,它还涉及到感知、定位、路径规划、车辆控制技术。在我们选择不再提交结果之后,就一直在采集实际道路数据,并一直在训练我们的模型。”

不难看出,图森未来并不沉迷于技术、数据,而是更加强调如何将技术落地,而这正是他们创业的初心。

后来,镁客网还了解到,对于数据集,每个团队每月可以提交三次结果。虽然图森未来不再提交结果,但是仍然可以从这两个数据集的官网看到,他们的排名仍在前6,且多个项目仍是世界第一。

视觉方案是低成本、可商业化的自动驾驶解决方案

目前,全球专注于商用车自动驾驶的公司,除了沃尔沃、奔驰之类的传统整车厂,还有去年被Uber收购的Otto。那么和这些公司相比,图森未来所做的货运自动驾驶有什么不同?

“传统整车厂在车辆控制上有先天优势,但是在算法方面则是新兴的科技公司更擅长、更精尖。”陈默认为“Otto 也是做自动驾驶卡车的,但与我们的技术选型不一样,Otto主要是激光雷达方案,图森是以计算机视觉为主的方案。”

图森未来陈默:用计算机视觉技术加速自动驾驶落地

图为图森未来北美测试车

其实,图森未来之所以会选择以计算机视觉为主,还有一个很重要原因是目前激光雷达解决方案的成本过高,想要实现大规模商业化还不太现实。而这,也正是图森未来的优势所在。除此之外,图森未来还有一个重要的优势,就是数据。

陈默介绍称:“图森拥有中国最大的自主数据采集和标定平台,月均上千小时的各类行车数据入库,日均超2万张图片由人工标定平台处理,这对自动驾驶是至关重要的。”

那么,弃用激光雷达是否有点过于冒险?陈默认为目前来看,计算机视觉技术是最优的解决方案,他说:“人类获取外界信息最主要的途径是视觉,自动驾驶是模拟人的驾驶行为,人是不需要精确3D点云才能开车的。而且视觉方案可以获得比激光雷达更丰富的信息,特别是远距离信息。因为在较远的距离,激光雷达拿回来的点云信息也是比较稀疏的,相对而言,摄像头会“看”得更远。当然,弃用激光雷达的主要原因是成本高,不易商用。如果有一天降价了,而且性能也达到要求,图森也会考虑使用激光雷达。”

诚然,鉴于特斯拉已经使用同样的技术实现了自动驾驶,就足以证明这样的解决方案也是切实可行的。

图森未来不仅要做自动驾驶技术服务商,还要做路网运营服务商

目前全球专注于自动驾驶领域的很多公司都对自己有着不同的定位,大致分为两派:解决方案提供商、技术服务商。而在和陈默聊到有关图森未来的定位时,除了说到自动驾驶技术服务商之外,他还提到另一个名称:城际物流路网运营服务商。

图森未来陈默:用计算机视觉技术加速自动驾驶落地

自动驾驶技术服务商,顾名思义,就是说图森未来以后会将自己的自动驾驶技术和解决方案授权给主机厂。那么,城际物流路网运营服务商究竟该如何理解呢?

陈默说到:“定位城际物流路网运营服务商,这是因为算法和数据对于自动驾驶来说都很重要。国内城际高速公路信息是一片待开采的矿藏,我们逐条高速公路进行测试和信息采集,这些信息被用于自动化物流,能够指导无人驾驶卡车进行定点决策。我们致力于成为路网信息的权威提供商,服务于电商和物流企业。”

接下来,在聊到做货运自动驾驶有哪些技术难点时,陈默说:“技术上,主要是我国卡车是机械控制,没有线控的,这对于信号执行上存在不便。所以我们与国内一家重型车厂达成合作,由对方提供可线控的重卡,作为我们的研发平台。并且,我们及时引入车辆控制方面的技术合伙人,使自动驾驶涉及的各方面都有技术合伙人,形成一个完整的团队。”

随后,镁客网还了解到图森科技的数据采集工作去年就已经开始,而他们的数据采集车就是一辆他们自己改装过的卡车。接下来,就等可线控的重卡交付之后,进行实车的调教和测试。

他们希望可以在2018年,分别在中美两国的道路上,进行第一条自动驾驶线路的商业试运行,实际测试图森自动驾驶为公路货运带来的效率提高。

结语

随着越来越多老牌车企、科技巨头、初创公司的加入,自动驾驶领域的竞争也变得更加激烈。其实,无论是激光雷达,还是计算机视觉解决方案,只要能够在保证安全的前提下真正的实现自动驾驶,就是一个切实可行的技术商业化解决方案。

而对于图森未来“城际物流路网运营服务商”的这一定位,镁客网认为这样的配套服务,相对于本身自动驾驶技术服务商的定位来说,也是一个不错的商业模式补充。但是,受限于成品车技术缺陷,图森未来想要真正将货运自动驾驶落地,还必须要走过漫长的测试道路。

【镁客·请讲】专注于报道科技创新项目;我们敞开心扉面对每一位创业者,力求为您呈现一群鲜活、有性格的品牌和人物;我们倾听创业故事和人生经历、探讨商业模式和行业趋势、对接资本市场和供需双方,以期为产业发展注入新的活力。

欢迎做客【镁客·请讲】,栏目合作请发送邮件至:post@im2maker.com

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到