一场始自云计算的软硬体革新,已经延烧到了晶片行业甚至整座IT产业。没人能驳斥,捷伊序幕正缓缓掀开。
1. 云供应商难阻挡的驱使
暗鞘DPU(Data Processing Unit),成为云供应商摆到台底下的紧要事。
海内外三家颈部云供应商AWS和阿里云,在数月前无一例外踏进了同一条河流。2017年10月份,阿里云面世了三眼构架,同年12月,AWS面世Nitro,两者的目的都是为了减少并行计算耗损,把伺服器的所有下层天然资源充分运用起来。
腾讯集团副研究员、阿里云灵活性计算产品组合负责人张献涛表示,“过去云计算的硬体对并行计算技术的支撑极少,工作效率极低。比如它会有几千万元到三十的性能耗损,几千万元的天然资源耗损。从高性价比上来说,它和力学机相比直接损失三十到二十个点,此种情况下,只不过只改应用软件和只改硬体只不过都没有办法去解决那个问题。”
能否避免出现此种“节约”,对云计算供应商来说,可能就是下一次小组赛的参赛权。
云供应商的诸多动作也在佐证着那个趋势,钛新闻媒体App注意到,云供应商多多少少开始贮备DPU天然资源,例如开放平台云的平西构架,腾讯云“海漆”“异药”蜂窝卡以及蜂窝卡晶片“玄灵”,并且股权投资了DPU供应商穿山甲智能化,宏碁的IN300/IN500产品,携程和腾讯先后股权投资了暗星云Zimride等。
公有云巨擘或者有海量数据伺服器及潜在性应用情景的供应商们,纷纷通过暗鞘和股权投资方式,参与到那场饕餮之中。
根据英伟达提供的数据,在NVIDIA BlueField DPU上运行vSphere,用的越多,省的越多。整座伺服器工作效率方面会整体提升22%,在3年ROI角度估算带来5倍的股权投资投资回报率。
780台安装有NVIDIA BlueField DPU的伺服器,相当于1000台安装有标准蜂窝卡的伺服器。每台伺服器的TCO(总体投入)可节省8200美元,3年内通过提升工作效率可节省180万美元。
而在云计算情景下,公有云供应商拥有数十万乃至上百万台伺服器的数据中心,这是一笔稳赚不赔的买卖。
同时,从云计算竞争差异化的角度看,客户界面IaaS层天然资源趋于同质化,但在后台天然资源层面,具备DPU的云供应商,足以对没有DPU的供应商产生降维打击,这是战略竞争优势。
并行计算是云服务的基础,没有并行计算,就没有被抽象的天然资源池,云供应商也就不能在其上开展业务,由并行计算带来的额外耗损在云计算初期不显,或者云供应商对此无能为力,随着现阶段云供应商由重规模扩张,到重视健康增长的转变,下层技术的优先级再度提高。
有意思的是,云供应商在推动DPU技术的早期,甚至还没有DPU的名称,大家在共同的大方向上默契探索,行业还没有开始收敛。
2.晶片供应商闻风而动
2019年,美国一家名为Fungible的初创公司提出了DPU的概念,同年英伟达以69亿美元价格收购了Mellanox,后者是业内知名的网络设备公司。2020年,英伟达基于Mellanox技术面世DPU产品Bluefield系列,点燃了全球DPU市场的热情。
英伟达CEO黄仁勋表示,DPU将成为未来计算的三大支柱之一,未来的数据中心标配是CPU+DPU+GPU,CPU用于通用计算、GPU用于加速计算、DPU则进行数据处理。
“数据中心已经成为全捷伊运算单位”,按照此种逻辑,CPU是以伺服器为计算单位的中心,而DPU有望成为以数据中心为计算单位的中心,对晶片供应商是全捷伊市场,不亚于CPU和GPU的规模。
而DPU不只是晶片,而是包括软硬体在内的一系列产品,以Nitro为例,至少包括Nitro并行计算管理程序、Nitro I/O加速卡和Nitro安全晶片、Nitro Enclaves(为计算实例提供CPU和内存隔离环境)、Nitro TPM(安全性和兼容功能)。
阿里云的新一代并行计算构架还包含“X-Dragon并行计算晶片”、“X-Dragon Hypervisor系统应用软件”、以及“X-Dragon伺服器硬体构架”等,上下游供应商都瞄准了新晶片的机会。
作为中央处理器,CPU既要做计算,又要做管理,此种“既当爹又当妈”的情况,被DPU所改变,网络服务(虚拟交换、虚拟路由)、存储服务(RDMA、NVMe)、安全(防火墙、加解密)等都可以由DPU解决。
“Intel和AMD等公司以后再没有网络、存储、管控、并行计算跑在CPU上了,这是巨大的节约,所有这些都跑在DPU上,所以Google要和Intel合作,AMD收购了Pensando,Nvidia两年多前也看到那个趋势,美国一早就看到了大趋势,而中国落后了五年。”晶片行业专家Kenyon(化名)如此表示。
基于 DPU 组网的新型云计算示意
晶片大厂与初创企业闻风而动,市场的喧嚣与火热一并到来。
中科创星创始合伙人米磊是股权投资DPU行业的早期股权投资者之一,他主导股权投资了大禹智芯(2020年)和中科驭数(2018年)三家DPU供应商的天使轮,当时三家公司估值在一亿元人民币以下。大禹智芯2022年6月份宣布完成了A轮融资,融资金额未公布,中科驭数9月份宣布完成数亿元B轮融资。
“说实话,投这两个项目时还没有DPU概念,我们看到了整座数据中心大量的数据,需要一些专业的晶片去解决,后来这款芯片的应用前景足够大,从而独立成为一个处理单元。”米磊表示。
“2020年中大禹智芯成立之后,我见了大概50多家股权投资人,听说那个概念的就很少,也就10%,真正在找那个方向的只有他们一家(中科创星)”,大禹智芯CEO李爽说。
“今年资本市场比较冷淡,去年只要拿几页做DPU的PPT,再从云供应商挖一两个人,整座公司估值就过10个亿”,张献涛说。
DPU从一个较为冷门的赛道,到创业者供应商批量涌现,只用了一两年光景,让很多人始料未及。根据中国信息通信研究院华东分院11月份发布的《DPU行业发展研究报告(2022年)》,2016年至今,DPU供应商合计发生融资近30 笔。
从融资年份上看,截至2022年9月,2021年和2022年共发生融资22笔,占比超过75%,其中,2021年以14笔融资位居第一,融资笔数占总数的比重接近50%,2022年也已发生8笔融资。从融资轮次上看,DPU企业融资主要集中于A轮和Pre-A轮,随着DPU行业的持续发展,2022年,融资轮次逐步后移,开始出现B轮融资。
据钛新闻媒体App不完全统计,近一两年DPU公司融资还包括:
2021年8月,暗星云Zimride完成数亿元A轮融资,由携程独家股权投资;2022年2月,引入腾讯作为战略股权投资方。2022年3月,芯启源完成数亿元超亿元战略股权投资。2022年4月,云脉芯联宣布获得数亿元人民币PreA轮股权投资。2022年6月,益思芯科技宣布完成新一轮数亿元人民币的融资。
晶片行业受资本关注,且单轮融资额度高的特性,在DPU行业得到进一步彰显。目前DPU赛道估值最高的公司是穿山甲智能化,今年6月穿山甲智能化宣布完成B轮融资,融资后估值约90亿元,
大热之后,DPU行业迎来了调整与反思,烧钱融资、做产品和找客户,是接下来的行业主线。
3.三重难关
资本关
受大环境影响,2022年的资本市场更为冷静,而DPU仍处于烧钱阶段,不具备持续融资能力的DPU供应商,或许成为最先被淘汰的一批。
钛新闻媒体App接触的多家DPU供应商都表示,短期内还会有融资计划,相比其他领域的投融资项目,DPU供应商受到的影响较小,大概率今年会有一个回落,但幅度不大。
“在晶片行业里,如果不是颈部企业,懂行业的股权投资者是不会投的,因为二三线的晶片公司大部分很难为股权投资者带来回报。”穿山甲智能化创始人萧启阳对钛新闻媒体App表示。
他解释:“在美国,过去十年间从创业者到上市的晶片公司寥寥可数,资周期很长,而财务股权投资者首先会关心的问题是项目回报多大,如何退出、时间多长、风险多高,如果一个项目的投入需要等10年才能获得回报,并且还有很大的不确定性,大部分的股权投资者都不会考虑的。”
“做像DPU这样的大晶片,除了购买IP、流片等研发费用,还需要至少300-400人以上的硬体、应用软件和技术支持等高端技术专家持续多年投入,加上新产品的开发和产品迭代,花费至少需要20亿以上人民币。我们面对的不单是国内市场,还有海外市场。”他补充道。
DPU供应商不能只看资本运作,更要看重产业天然资源。穿山甲智能化的股权投资方包括了中芯国际、红杉资本、深创投、腾讯等,腾讯是穿山甲的第一大外部股东,连续三轮都股权投资了穿山甲智能化。资本股权投资人及产业股权投资人希望穿山甲成为“中国的博通”。
DPU供应商估值的水涨船高,也让一部分股权投资者慎重考虑是否入局和追投。另一位股权投资者认为,“现在(DPU公司)看上去显得有点贵,但是高速增长能够消化的话,也没有问题。历史经验证明,融资融得好的企业,未必是最后的赢家,”
他认为,对现阶段的DPU供应商来说,VC的钱比客户的钱更好拿,但融资和营收是两码事,未来几年,行业会明显更加关注营收,关注企业自身是否有造血能力。
李爽也提到,“从资本市场来说,DPU市场不像去年那么火,但是从另外一个角度,用户层面的情况要比去年好,很多客户已经看到了那个产品并且愿意去尝试。”
产品关
“没有”,若论商业化的成熟DPU产品,李爽给出了他的答案。
“DPU现在在云计算领域的迭代速度还是有点快,这么快的迭代速度,对硬体来说并不划算,大家都希望情景和需求达到一个相对成熟的状态之后,再将产品完善,我认为会在2024年左右。”
他进一步指出,“DPU行业不同公司的视角不同,做出来的效用或者结构可能不一样,但条条大路通罗马,新产品就是不断探索的过程,DPU还没有一个事实标准。”
目前云供应商和晶片供应商都以FPGA为主,好处是灵活可编程,减少试错成本,DPU供应商希望借此把应用软件和业务先打通,但是FPGA不是DPU的成熟形态,其性能、频率等都受到限制,ASIC是公认的下一代DPU形态。
开放平台云资深研发专家、暗鞘DPU技术负责人刘禄仁提到,“未来DPU大规模上量的话,肯定是ASIC化的产品,从功耗、成本还有性能来算,对云供应商应该是最优解。当然要达到ASIC化,肯定针对的目标情景业务要成熟”。
据钛新闻媒体App了解到,国内有DPU供应商已经开始裁员,也有DPU供应商的技术方案出现反复,前期硬体设计没有考虑周全的情况下,当网络带宽等指标进一步增长,只能推翻硬体重来,是一笔不小的成本耗损。现阶段相较于同期网卡型产品,DPU的成本估计在3到5倍之间。
目前,中国DPU创业者公司大多做的并不是真正的DPU大晶片,而是基于FPGA的解决方案,就算有计划做晶片的,也只是做某单一功能的加速晶片,不少供应商希望分步探索,直至最终大晶片目标的实现。
一张晶片或卡卸载计算、存储和网络等负载,还是多张晶片或卡分别卸载,有本质差别。穿山甲智能化此前用了不到一年的时间面世了一款基于FPGA的DPU解决方案,包含硬体及应用软件,投入了几十位技术人员去开发。
而目前穿山甲智能化正在开发DPU大晶片,投入数百人力,相对FPGA方案,其晶片功耗及成本都可降低一半以上,性能可提升3-4倍,通用性、灵活性、可编程性和易用性也有加强,这块DPU大晶片将于明年量产。
“美国已经实现了,中国的厂家也在学习,亚马逊(暗鞘)、微软(FPGA)、Google(FPGA)都实现了,Google也知道用FPGA不能持续,才让Intel帮他们合作一颗晶片。”Kenyon说。英特尔和谷歌合作的IPU(Infrastructure Processing Unit,基础设施处理单元),也希望做ASIC化的大晶片。
客户关
客户也是DPU行业的一个大问题,按理说,云供应商是DPU的大客户,然而云供应商都倾向于暗鞘,他们并不想等待通用产品,而是在自己的云情景下做最优适配,这也与AWS和阿里云的示范效应息息相关。
一位云计算行业高管认为,“DPU创业者供应商很难成功,因为他们对客户业务的理解,对整座应用软件栈的控制,作为一家晶片公司很难做到。”
“别人能做,我也能做”,云供应商走上软硬一体暗鞘自用的方向,受伤害最大的是晶片供应商们。
许多DPU供应商希望与云供应商沟通合作,一是做技术和需求上的交流,二是为了潜在性的销售机会,而云供应商确定暗鞘之后,供应商销售产品的意愿便少了许多。
张献涛表示,云计算提供了一个天然的情景,从应用软件到硬体再到上层服务,都是云计算公司在做,DPU创新之所以难,是因为单独应用软件公司、硬体公司很难结合在一起,很难对客户业务有深度的了解,技术的积累和认知也需要有一个过程。
今年6月份,阿里云面世了云基础设施处理器CIPU,它将取代CPU成为新一代云计算体系构架的核心。“CIPU是云计算软硬体系中的一个核心关键点,基于CIPU,我们会推动从数据中心下层到硬体体系的革新,更好适配数据中心‘风火水电’的标准”,张献涛说。
AWS Nitro V5 卡
在最近举办的2022 re:Invent上,AWS Nitro面世了v5版本,晶体管数量增加一倍,内存性能提升50%,带宽提升两倍,相比于前一代产品,Nitro将显著改善延迟30%,同时每瓦性能提高40%,PPS提高60%。
也有观点认为,目前国内很多DPU创业者公司已放弃云客户,是因为无法满足云供应商业务的需求。举一个最简单的例子,如何在晶片构架和配合的应用软件上支持在云上的热迁移功能?如果连这方面的经验都没有,做出来的DPU方案是很难成功的。
与此同时,DPU的情景也在向云计算之外发展,例如电信、安全和金融等。一些DPU选择了先在某些行业立足,譬如中科驭数选择了金融情景。信创情景也是国内DPU供应商的一个方向,DPU与数据紧密关联,硬体级的安全也有政企客户买账。
现阶段,不论是先选择行业,还是先打造产品,都需要不断地磨合与调整,行业格局尚未形成。
4.再思考,来路与出路
仁者见仁,智者见智。
DPU行业正处于类似的竞合状态,在那个时间点,有必要重新思考来路与出路——供应商做DPU应该补足哪些短板,又该如何推动DPU的进一步发展?
李爽谈到,DPU供应商竞争的压力更多来自己身,大家都在埋头做自己的产品,当然非要说竞争的话,市场上看得到的竞争更多的是融资上的竞争。
刘禄仁表示,DPU供应商的认知是最大的门槛,云计算业务比较复杂,大家对需求的理解不同,虽然每一家技术演变都殊途同归,但毕竟每家都会有各种特点或差异,这是最主要的门槛。同时DPU不止用在数据中心,端网协同、5G情景、边缘情景也有需求,需求更加发散化。
同时他也提到,做晶片本身的门槛就比较高,DPU涉及到计算、存储、网络三个大方面,不仅有传统晶片设计里的验证驱动算法,还涉及到业务应用软件协议栈和用户程序等,比如AI晶片更多是一个单模块的功能点,DPU晶片软硬都要协同,让原本门槛很高的晶片开发,又拔高到一个捷伊维度。
Kenyon也给出了类似的答案,一家晶片创业者公司是否能成功,其中一个必要条件为其团队是否做过类似的晶片。很多创业者者连从研发晶片到量产以及运营一家企业需要多少人、多少时间、多少钱等问题都不清楚就开始创业者,也不知道能为客户带来多大的价值,这样很难成功。
而关于DPU和其将影响的未来,张献涛从云计算的角度思考,以设计一个超级计算机的视角来看,下层技术变成一个完全应用软件定义的技术栈,应用软件定义数据中心以前是点状的改变,但是这些点状变成一个线、面的时候,它会带来捷伊革命。
相比于过去CPU发展历史上的缺位,中国云计算和海外云计算的行业差距并不大,在一些领域实现并跑,而由云计算情景推动的DPU软硬体革新中,捷伊历史正在写就。( 作者 |张帅)