计算机视觉中的深度学习:技术、市场和5个你想不到的未来
本文从算法、市场及硬件三个角度观察深度学习对计算机视觉的影响。
【编者按】本文由新智元整理,来源:vision-system.com,整理:王楠
本文从算法、市场及硬件三个角度观察深度学习对计算机视觉的影响。以下三个视频中,谷歌TensorFlow移动端和嵌入式应用团队负责人Pete Warden介绍了如何用TensorFlow框架开发不同的低能耗深度学习产品。调研公司Tractica首席分析师表示,到2024年,深度学习服务业产值将超过500亿美元。IEEE Fellow Chris Rowen预测,神经网络将催生出新的价值链,全新的IP、工具和数据服务也会应运而生。
嵌入式视觉联盟主编Brian Dipert今天发布博文,介绍了2016年嵌入式视觉峰会(Embedded Vision Summit)中有关深度学习的内容:
谷歌工程师Pete Warden介绍如何利用TensorFlow框架,开发为Google Translate、Google Photos等不同产品订制的深度学习方案;
调研公司Tractica的首席分析师Bruce Daley从市场的角度介绍深度学习在计算机视觉产业生态中的影响,以及Tractica对未来计算机视觉市场发展和机遇的预测;
最后,电子设计自动化软件公司Cadence的CTO、IEEE Fellow Chris Rowen给出了神经网络在计算机视觉产业的五大趋势。
让嵌入式机器智能成为可能
TensorFlow移动端和嵌入式应用团队负责人Pete Warden,介绍了如何使用TensorFlow框架开发不同的深度学习产品,还谈了谷歌为什么选择开源TensorFlow,以及让这个机器学习框架支持低功耗应用的方法。Warden此前是机器学习算法公司Jetpac 的CTO,在2014年该公司被谷歌收购后加入谷歌。
Warden开场直奔主题,再次为人尽皆知的TensorFlow打广告:是深度学习开源框架;支持视觉、语音及自然语言处理等多种应用;在谷歌公司内外都有广泛应用,在谷歌内部的应用包括Google Translate、Google Photos、OK Google、RankBrain。
Warden号召开发人员都来使用TensorFlow,因为TensorFlow拥有经过完善测试、产品级的代码,专门针对工程师需求,历史记录会得到妥善管理,他们团队一直认真工作,所以长期支持没有问题。
TensorFlow使用图表示计算任务,图中的节点被称之为 op,一个 op 获得 0 个或多个 Tensor, 执行计算, 产生 0 个或多个 Tensor。每个 Tensor 是一个类型化的多维数组,比如一个图像集可以表示为四维浮点数数组。
Warden介绍了怎样用TensorFlow打造App:首先,下载一个免费的TensorFlow模型,当然这个模型是已经训练过了的,然后,使用你自己的图像数据训练这个模型。这之后就可以开始用TensorFlow搭建自己的平台,在移动设备上用C++运行。Warden接着讲了在TensorFlow上调用C++的方法。
在谈到为什么世界上还需要一个开源机器学习框架的时候,Warden表示,TensorFlow与OpenCL不同,是一种描述神经网络的高级语言,不过TensorFlow也支持OpenCL和CUDA。至于TensorFlow与OpenCV的区别——总之OpenCV很好,有很多传统计算机视觉模块,鉴于深度学习得出的结果一般会更好,将两者整合起来也很容易。
TensorFlow具有独一无二的架构,模块化和数据流的优化性能高于其他开源深度学习框架。在谷歌,TensorFlow的开发过程一直是产品导向的。
作为移动端和嵌入式应用团队的负责人,Warden强调,TensorFlow非常重视移动端和嵌入式应用的开发,TensorFlow结构很容易简化,也就能够应用于低功耗App。TensorFlow支持推理的8比特整数计算,并且专门针对8比特整数代码做了优化。
深度学习服务产业市值将超过500亿美元
深度学习算法是加速大规模数据分析并使其自动化的关键工具,有很多商业应用。调研公司Tractica的首席分析师Bruce Daley从市场的角度介绍深度学习在计算机视觉产业生态中的影响,在名为《深度学习如何拓展计算机视觉市场》中,Daley围绕深度学习的计算机视觉市场和技术、使用案例以及产业生态。作为Tractica的首席分析师,Daley还给出了Tractica调研发现的具体市场机会和产业整体趋势。
首先,Daley回顾了人工智能发展历史及标志性事件,快进到2015年,企业级人工智能应用开始出现。根据Tractica预计,到2025年,光是深度学习软件的销售额就能达到104亿美元,而且硬件和服务还会增长更多,其中深度学习相关服务的产值高达500多亿美元。
深度学习虽然不会对生活造成直接影响,但它会从最根本的层面改变生活——改变数据。你可以用同样是算法处理各种不同类型的数据。随着社会越来越数字化,数据增加,深度学习展现出了优势。不过,Daley也指出,在产品周期里当过了成熟期以后,数据的价值就会逐渐降低。同时,深度学习也有局限:虽然应用广泛,但依赖高质量的数据,无法用数学语言描述,人才严重不足。
深度学习的市场将是这个样子的
到了具体应用,Daley表示,Facebook 用户每天都会上传3.5亿张照片,谷歌的图片列表更是高达1万亿之多,用人力给这些图片打标签是不可能的,但这些又都是宝贵的数据,这时候深度学习就派上用场了。
就像谷歌可以用计算机识别猫,如果一个人在网上看了很多猫的照片,那么计算机会自动推荐更多的与猫相关的内容。不过,这种技术很神奇,但消费者为什么会花钱买呢?因此必须有好的商业模式。
接下来,Daley介绍了使用深度学习的计算机视觉系统在农业、零售业、服装(量身定制)、广告、制造等产业中的应用和趋势,以及在这些产业中值得关注的企业。
神经网络:5个你想不到的未来
最后,电子设计自动化软件公司Cadence的CTO、IEEE Fellow Chris Rowen,分析了神经网络计算的本质及局限,尤其是在实时和嵌入式系统中的应用。
Rowen表示,虽然最近神经网络可能有些过于“火”了,但还是有一些机会可以切实分析地分析一些意想不到但却很有可能发生的未来。Rowen预测,计算机视觉产业接下来会发生一系列变革,从神经网络改变数据商业模式到云端、全新软硬件中的应用。
Rowen在演讲中给出的不怎么惊人的预测是:
神经网络的云端的应用会增多
神经网络很快将拥有实时嵌入功能
能耗和带宽的限制将推动CNN在嵌入式和服务器等处理器上的优化
实时神经网络不仅能识别物体,还能识别行动
计算机视觉将成为计算和高端部署的主要问题
然后,Rowen 认为很有可能出现的是:
通过网络和引擎结构优化,近期会带宽会编程原来的20倍
不久后将会出现1000-tera MAC神经网络嵌入式芯片和1000000 tera-MAC神经网络服务器
新的EDA模式
新的价值链会带来全新的IP、工具和数据服务
数据为王,拥有大规模、多样化数据的人是赢家
可能伤及隐私
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新