对话紫光云:“芯片设计上云”已成共识, 云计算有望助力国产EDA弯道超车
紫光云公司CTO办公室主任邓世友表示,芯片上云的本质,就是用算力换时间,用云端CAD工具解放生产力。
图 | 紫光云公司CTO办公室主任邓世友
整个芯片设计环节中,仿真验证不仅复杂,还是最耗时的。不夸张地说,在部分芯片设计中,这一过程耗费时间的整体占比更是高达70%。
如果是一家资金充足、人员团队上规模的IC公司,他们大可以采购服务器自建算力中心,自建团队运维CAD研发环境。反之,如果一家资金和团队规模均有限,时间人力成本的消耗和响应速度快慢就成为了一道“拦路虎”。
而现实情况是,截至2020年底,国内共有2218家芯片设计企业,其中高达87.9%都是人员规模不足100人的。在芯片性能迭代速度不断加快的当下,他们可以怎么做?
带着这个问题,在6月10日由镁客网承办的IC设计开发者大会上,我们对紫光云公司CTO办公室主任邓世友先生进行了采访。
一场时间与算力的博弈
芯片迭代速度加快的另一面,是摩尔定律被打破,这背后不仅存在技术的进步,也有着市场需求的“倒逼”。
针对这一事实,有一个数据已经被多次拿出来讨论,那就是OpenAI于3年前发布的一份报告,里面提到,从2012年到2018年,AI算力需求增长超过了30万倍,平均每3.43个月就会翻一倍,这已经远远超过了摩尔定律。
反过来,正是市场对算力需求的急切需求,逼迫着芯片设计者们不断提高性能、加快芯片迭代速度。显然,摩尔定律中时间与算力之间的平衡已经被打破,企业需要找到一条新路径,在保证性能稳定提升的前提下,进一步缩短时间成本。
而说到芯片设计,这其中有五大核心要素,分别是IP、PDK、EDA、IT和CAD,这对于芯片设计公司而言,从自主性角度出发,考虑到仿真验证过程的耗时之长,从IT处下手增加算力支持算是一个见效最快的方法。
“我们发现,随着芯片设计工艺制程越来越先进,规模越来越大,诸如紫光集团内部的紫光展锐、新华三半导体,对于算力的需求是非常庞大的,为了支撑新的芯片研发投片,每年都会投入大量的服务器、存储等相关IT设备。”邓世友表示。
但同时他也表示,芯片设计业务本身对于算力的需求都不是恒定变化的,而是呈现出一条波动性很强的曲线,尤其是投片前3个月,对算力的需求是“无限”的。
“面对这种波动性很强的业务需求,IT团队很难通过自购设备来满足。若是买多了,可能会出现设备闲置,若是买少了,可能算力又不能完全满足,不管是哪一种,都是成本在无谓消耗。”
这么一来,芯片设计企业在采购IT设备的时候,既需要考虑到项目算力的需求,又要避免无谓的时间消耗,该如何做?
云,或者说“让芯片设计上云”,似乎是当下的最优解。邓世友解释:“云,天然具备弹性特征,能够满足算力需求的波动性,且是非常契合的。”
芯片上云=用算力换时间
简单来讲,“芯片上云”的背后,就是用算力换时间。
云服务的商业模式是按时长付费,这意味着在云端用1台服务器运转100小时的成本,和100台服务器运转1小时的成本相差无几,但这对于芯片设计的工作任务来讲,效率提升的是100倍。
当然了,上云也并不意味着将本地设备全部搬到云上。以紫光芯片云为例,邓世友指出,“我们眼下主推混合云模式,建议将本地设备、资源作为一个常备算力进行储备,再辅以云上算力资源的弹性补充,两者协同,才是一个最优的性价比方案。”
但是回到帮助企业缩短芯片设计周期这个问题,仅仅在云端提供算力支持只是基础服务。因为缺乏专职IT人员、CAD工程师等人才,致使一些企业即便拿到了云端算力资源,也很难快速地搭建芯片设计环境。
针对这个问题,紫光芯片云也交出了自己的成果。就在今年4月新发布的2.0版本中,算力之外,紫光芯片云开始注重起芯片设计环境。
具体来看,紫光芯片云提供的U-Imp/U-Chip芯片设计工作流执行平台,将EDA工具、工艺技术文件、集群作业调度、项目管理和数据管理等模块集成在此平台之上,IC研发工程师可以通过图形化GUI界面,直观快速的进行PPA(Performance, Power, Area/Cost)评估和完备严苛的物理实现过程控制。U-Imp/U-Chip支持多模块并发执行、自动化RTL-GDSOUT流程、自动化的Checklist检查和QOR报告收集,大幅缩短IC设计项目实施中的Syn综合/FV形式化验证/ STA静态时序分析/物理设计/Sign Off等流程时间,提高芯片设计效率、节约成本,并为芯片投片一次性成功进行流程上的保障。
此外,紫光芯片云还融入了紫光集团旗下新华三半导体、紫光国芯等企业的芯片设计服务能力,也与EDA、IP、Foundry等生态合作伙伴对接,为IC企业提供一站式的设计服务+云服务打包Turnkey方案交付。
上云之前,先聊聊这两个问题
国内芯片上云领域中,紫光是领先者。而从紫光芯片云2.0版本来看,其更为强调的是一种“生态”,这也是当前芯片上云的重点工作之一。
只是在这之前,有两个问题我们必须得提出来,一个是安全,另一个是带宽与时延。
· 安全
众所周知,芯片设计是一个高门槛行业,面对数据信息等牵一发而动全身的核心资产,芯片云该如何做,才能让客户放心地在云上部署芯片设计等工作?
目前在行业中,这一问题的解决方案主要有两类,一类是直接对设备作物理隔断,另一类则是在虚拟层面进行加密。
这两种方式也是紫光芯片云所采用的。邓世友表示,物理隔断方面,除了物理机房间的隔断,在为客户提供的芯片云服务设备,与通用公有云资源池物理隔断,同时与互联网Internet物理隔离。
至于加密,这也是各类型云服务厂商的“惯有手段”了。只不过邓世友向镁客网指出,将数据进行加密存储虽然保证了安全性,但传统的加密会导致性能下降。芯片上云的本质是用算力换时间,但如果加密后,导致性能下降而使得算力大打折扣,最终延长芯片设计任务时间,这就有点得不偿失了。
图 | 紫光芯片云芯片仿真统一解决方案
针对这一点,紫光芯片云选择采用CPU加密指令集加速等底层技术,进而对启用加密后的性能做出优化,“目前,我们已经做到在满载运行的情况下,将性能损失缩小至10%以内。”
此外,同样是加密,邓世友告诉镁客网,紫光芯片云还做了一个创新,所瞄准的是加密的核心——密钥。
“一般云厂商的做法,是将密钥管理放在云端,由云服务端为客户分发钥匙,相当于配钥匙的机器掌握在云厂商手中,这样一来,客户肯定是不放心的。”他介绍到,“紫光的方案与之不同,是将配钥匙的机器打造成一个物理设备,并且放置在用户端,或他们自己的机房中,由客户自己管理、分发密钥。”
· 带宽与时延
提及云服务,安全和带宽基础性能,也是客户最先关心的两个问题。
在云服务上,带宽小、时延长意味着卡顿,而一旦出现卡顿现象,留给芯片工程师的的体验会大打折扣。
针对这一点,紫光芯片云的做法是将云节点建设在离用户最近的地方,在芯片设计企业颇多的北京和上海部署两个节点资源池,将云驻地化,实现数据不出城,同城裸光纤网络接入。
“以上海为例,如若是上海本地的企业,我们可以做到万兆裸光纤直接接入云端,时延控制在5ms以内。”
“芯片上云”已成业内共识,也是“弯道超车”的机会
严格向前追溯,国内芯片上云的开端始于2019年,但是更早的,在2017年,国外三大EDA巨头(Synopsys、Cadence、Mentor),以及亚马逊、微软和谷歌三大云服务厂商就开始部署相应方案,并相当成熟,也有了相关成果与案例。
“虽然起步较晚,但是现在,包括很多芯片设计企业、其他云服务厂商在内,都已经达成了一个共识——EDA上云是大势所趋。”邓世友表示。
大家都认同了这一趋势,且国外的案例也证明了这一模式的可行,随着国内云服务模式的不断推广,越来越多的企业开始尝试在云端进行芯片设计验证。在助力国产芯片设计这条道路上,云、AI等技术的参与比重正不断增加,且方法上也是各有特色。
比如紫光云,充分利用云服务的特性,满足计算弹性、存储弹性和访问便捷性的同时,也通过接入第三方设计公司的能力,全方位地为芯片设计企业打造一个完整的芯片设计环境,从算力、CAD工具等关键环节出发,达到降本增效的效果。
另外,我们还看到一些企业也在尝试搭建平台,只不过这类平台旨在利用AI技术,来帮助芯片设计企业优化IC设计,力求在最优模式下设计出性能最优的芯片。
而众所周知,在芯片设计环节,国产芯片最为“卡脖子”的环节在于EDA软件。数据统计,2020年的国内EDA市场中,三大巨头就占去了85%,国产厂商市场份额虽在近两年内有所增长,但也仅有14%。
看到这里,我们不禁发问,随着云计算、AI等技术以一种创新方式参与到EDA等关键领域中,能够助力国产EDA等实现“弯道超车”吗?
当镁客网问及此,邓世友认可道,云计算、AI在各行业的渗透率越来越高,对于EDA也不例外。“云计算与AI带给EDA软件不仅仅是技术上的辅助与加速,同时也是商业模式上的创新与变革。”
他进一步表示,虽然在全流程上,国产EDA软件依旧与三大巨头存在不少差距,但在不少EDA点工具上,国内却也是存在不少优秀产品的。
而以云服务对国产EDA的助力为例,“基于云平台,可以融合国内多家优秀的EDA点工具,组合成全流程EDA,实现优势互补,进而推广给芯片企业。只有让更多的芯片企业用起国产EDA工具,才能帮助国产EDA工具实现迭代优化,达到更好的良性发展。”
与此同时,邓世友也指出,EDA工具云化,一方面可以降低芯片企业使用正版EDA工具的门槛,另一方面也可以从根本上解决软件授权问题。
不过,我们也可以看到,近年来,已经有不少三巨头的高管选择离职创业,同时国内的利好政策以及国产化需求,也在推动EDA行业走向突破。这一点上,国产EDA软件国内市占率从5%到14%的增长事实就是一个有力证明。
而如同国产EDA软件的发展与突破,在其他关键领域如IP等,随着智能芯片的出现也正产生有别于传统IP的新需求。
可以确定,云计算、AI等前沿技术的深度参与,给国产芯片“卡脖子”的现状撕开了一个小口,带来了一线生机。
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新