人工智能专用芯片是大势所趋,而IP授权是当前实现商业化的最佳选择
人工智能芯片也有通用、专用之分,在商业化道路上也有着不同的选择。
8月中旬,人工智能芯片初创公司寒武纪获得1亿美元的A轮融资,至此成为该领域的第一个“独角兽”,紧接着,9月初,华为在IFA 2017上正式发布了全球首款面向手机的人工智能芯片“麒麟970”。
就在这前后不到一个月的时间里,“人工智能芯片”成为了人人争相热议的一个产品、一个产业。
人工智能芯片热度渐升,多家公司早已着手布局
前段时间,因为被看做是当前智能家居的入口之一,“智能音箱”一下子受到了人们的极大关注,而随着小爱同学、天猫精灵等产品的相继推出,更是将这股热潮推上了顶端。
就在这股浪潮渐渐平稳的时候,“人工智能芯片”紧跟而上,引起了人工智能领域的又一波新的浪潮。事实上,在这第三次的人工智能浪潮中,作为让人工智能技术更快、更好运行的基础硬件设施,人工智能芯片必然是未来智能化时代的一种趋势。也因此,虽然人工智能芯片相比于其他人工智能技术和应用显得低调得多,但它的布局依旧是众多厂商眼中不能错过的“机遇”:
买买买的英特尔——至今,为了不再错过人工智能芯片,英特尔陆陆续续收购了Altera、Yogitech、Nervana、Movidius、Mobileye等多家公司,拿下了他们的FPGA等多种技术。
GPU在手,谁与争锋的英伟达——凭借着GPU在人工智能应用中的先天性优势,英伟达已经走在了人工智能芯片的前列。不过,就在最近,黄仁勋也发布了一款针对深度学习而打造的芯片Tesla V100。
紧盯FPGA的微软——微软把重心放在FPGA人工智能芯片上,已经被用在Bing搜索的支持上。另外,其也推出了基于FPGA的视觉芯片A-eye,让摄像头具有视觉理解能力,可应用在机器人、汽车和无人机等多种智能产品。
与此同时,国内的厂商也是蠢蠢欲动。
首个独角兽“寒武纪”——因为高达1亿美元的A轮融资,寒武纪成为了人工智能芯片领域的首个独角兽,通过的IP授权的形式,其技术已经在华为人工智能芯片麒麟970上面得到了商业化;
主打“嵌入式”的地平线机器人—— 地平线机器人致力于打造基于深度神经网络的人工智能“大脑”平台,包括软硬件。在硬件上,其此前曾表示旗下的人工智能芯片“盘古”已经成功流片将商用;
……
从上面多家企业的布局和产品来看, 我们能够清晰地认知到,虽然“人工智能芯片”相比于语音识别等技术并没有得到大众更多的关注,但是作为人工智能的基础硬件设施,其已经成为诸多公司抢夺市场、占据风口的一大战略制胜点。
人工智能加速,人工智能专用芯片是未来趋势
深度学习算法是实现人工智能技术和应用的核心,其在运行过程中需要对海量的数据进行运算处理——用已有的样本数据去训练人工神经网络、用训练好的人工神经网络去运算其他数据。对于传统计算架构而言,这将是一个极大的挑战。
面对深度学习算法这一计算新需求,GPU(图形处理器)、FPGA(可编程门阵列)、ASIC(专用集成电路)等成为了人工智能芯片领域的“被追捧者”。比如GPU,相比于CPU,其具有高并行结构,拥有更多的ALU(Arithmetic Logic Unit,逻辑运算单元)用于数据处理,适合对密集型数据进行并行处理。
值得我们注意的事,不管是让英伟达一举闻名的GPU,抑或是当前与GPU不分伯仲的FPGA,在属性上,它们都只能算是人工智能通用芯片。相比于一开始就是“私人订制”的ASIC,在深度学习算法的运行上,GPU和FPGA或多或少都有着一些局限:
GPU局限:GPU能够游刃有余的训练人工神经网络,但在输出应用时,它一次只能处理一张图像;相比于FPGA的灵活,GPU硬件结构固定,不具备可调整性;在实现相同性能的功耗上,GPU远大于FPGA以及ASIC。
FPGA局限:为了实现可重构特性,FPGA内部有大量极细粒度的基本单元,但是每个单元的计算能力都远远低于GPU中的ALU模块;在深度学习算法的运行速度和功耗上,FPGA表现的都不如ASIC;FPGA价格较为昂贵,在某些情况下甚至会高于ASIC。
不可否认,对于当前人工智能的发展,GPU和FPGA都做出了不小的贡献,但是从未来发展趋势来看,人工智能专用芯片才是未来的核心。
从上面的一些比较我们可以看出,在功耗和速度上,GPU、FPGA与ASIC之间还是有着一定差距的。
针对人工智能芯片的通用与专用的区别,地平线机器人芯片专家马凤翔称,相比于通用芯片,专用芯片是为特定场景而定制的,具备低功耗、低成本、高性能的优势。再通俗一点讲,就如寒武纪创始人之一的陈云霁所举出的例子,普通的处理器就好比“瑞士军刀”,虽然通用,但不专业,造成浪费,但是做菜的时候,还是菜刀得心应手,而专业的深度学习处理器就是这把更高效、更快捷的“菜刀”。
与此同时,不仅仅是性能的要求,随着人工智能技术的发展,其应用范围也将进一步扩大。未来,自动驾驶、机器人、智能家居等等终将充斥我们的生活,这其中所隐藏的将是一个无可估量的市场需求。届时,不管是所需要处理的数据,抑或是运算速度,与现在相比都将不是一个量级,若想做的更好,就只能向人工智能专用芯片靠拢。
人工智能专用芯片商业化,IP授权是当前的最佳出路
随着寒武纪成为AI芯片领域首个“独角兽”、华为麒麟970的推出,以及后面苹果、三星等多家重量级厂商相继宣布AI芯片的规划,“如何实现技术、产品的商业化落地”就成为了接下来需要厂商们亟待解决的问题。
目前,运用ASIC架构的人工智能专用芯片中,最典型、最具代表性的当属寒武纪旗下的产品和谷歌的TPU了,不同的是,前者服务的对象是广大客户,而后者则是服务于自己的人工智能系统Tensor-flow。
谈及商业化,虽然中星微、寒武纪的产品此前都有所流片,但是从当前的整体来看的话,相比于流片,IP授权或许更适合人工智能专用芯片,尤其是对于创企而言。至于原因,可以总结为两点:
第一,与其急着流片实现商业化,不如缓下脚步达到芯片生态圈
的确,对于企业来说,流片是一种能够快速实现商业化的方法,并且收获的利润也是可观的。但是,这样一来难免显得有些激进,一不小心或许就会造成失误。相比之下,通过IP授权来慢慢拉拢客户构建生态圈、“蚕食”人工智能芯片市场显得更为从容有序。
说到IP授权,我们第一个想到的就是ARM,作为后起之秀的它通过IP授权的策略打败了当时的业内老大Intel。ARM大中华区总裁吴雄昂曾一句话总结成功——建立了一个有强大活性和创新力的生态圈,为生态圈的合作伙伴提供了一种共赢模式,参与其中的企业有很高的成功率和利润空间。另外,ARM生态圈的成员并不受限于ARM平台,在此基础上可以有无限的创新空间。
当前,深度学习算法可能还没有那么的成熟,而人工智能的极大需求又对芯片的性能和功耗提出了新要求。与此同时,ASIC还有一个bug——架构固定不具备灵活性,这是其略逊于FPGA的一处。不过,通过IP授权,这将允许客户在指令集基础上根据需求创建出自己的内核架构,并可添加各种片内外设比如通信接口等等,从而生产出自己的“处理器芯片”,就像此次的华为麒麟970。
目前来讲,人工智能还处在一个初级阶段,相比于“思维定式”,更为灵活的架构或许将会更受欢迎。如此一来,围绕人工智能专用芯片将会逐步形成一个生态圈,这对于芯片企业以后的规划而言将是重要的一步棋。
第二,人工智能专用芯片流片具备风险
前面也提过,相比于人工智能通用芯片,人工智能专用芯片具备低成本低功耗的优势,但是有一个前提,那就是实现高出货量。
比如ASIC和FPGA,比起一次性成本,前者的成本是远远高于后者的,不过,在同样实现高量产的前提下,后者的成本将转变为前者的10倍,甚至是100倍。因此,如果不能实现量产的话,这对于人工智能专用芯片将是一件极为不利的事。
当然,在性能和功耗上,人工智能专用芯片遥遥领先,但也不能忽视其一旦流片,功能就不能更改的事实,这也是造成人工智能专用芯片上市慢的一个原因所在。
结语
在多起事件的联动下,人工智能专用芯片已经成为了一个“大蓝海”,引得国内外科技巨头、AI创企纷纷跳入其中,意图攀上中间那座小岛的制高点。
最后,攀上那座小岛的只会是人工智能专用芯片,至于最后是谁,又是怎么攀上的,我们目前只能持以观望的态度。
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新