第三颗“大”芯片数据处理器DPU: 呼之欲出的百亿赛道

日期:12-30
DPUcpu处理器

作者:来莎莎

[ DPU的概念最早由硅谷创业公司Fungible提出,在英伟达收购网络解决方案厂商Mellanox并重新包装定义DPU后,这一概念一炮而红。目前,该市场仍处于发展初期,各厂商定义有所不同。主流的DPU定义由NVIDIA提出,即DPU是集数据中心基础架构于芯片的通用处理器。]

继AI芯片后,DPU(数据处理器)成半导体的新热点。

全球芯片巨头英伟达、英特尔先后下场,国内涌现了中科驭数、云豹智能、大禹智芯、云脉芯联、星云智联、边缘智芯等一系列创业公司,下游云计算龙头AWS、阿里云等厂商也早已布局……DPU行业迎来百家争鸣时期。

12月21日,专注于智能计算领域的DPU芯片公司中科驭数宣布完成数亿元规模A+轮融资,由麦星投资和昆仑资本联合领投。这是继7月底完成A轮融资之后,该公司今年获得的第二笔数亿元融资。之前,5月成立的云脉芯联在10月获得IDG、字节跳动和壁仞科技的投资。

DPU也在搅动着二级市场。21日,左江科技回复投资者称,公司自研可编程网络安全处理芯片在功能定义和架构设计上已具备DPU相关特性要求,此后股价连涨三天。

头豹研究院预测,2025年全球DPU市场规模将达到135.7亿美元。“老钱”和“新贵”共舞的赛道,谁将脱颖而出?

第三颗“大”芯片

在数据中心时代,CPU一家独大的局面将一去不复返。

DPU被视为仅次于CPU、GPU的第三颗大芯片,负责处理“CPU做不好,GPU做不了”的数据任务。在英伟达等厂商的环伺下,英特尔在数据中心的市场将不断被蚕食。

DPU的概念最早由硅谷创业公司Fungible提出,在英伟达收购网络解决方案厂商Mellanox并重新包装定义DPU后,这一概念一炮而红。目前,该市场仍处于发展初期,各厂商定义有所不同。主流的DPU定义由NVIDIA提出,即DPU是集数据中心基础架构于芯片的通用处理器。

DPU的产生源自应用驱动。中科驭数CEO鄢贵海表示,2010年以前,网络的带宽年化增长大约30%,近年达到45%;而CPU的性能增长从10年前的23%,到近年降低至3%。当网络带宽增速和CPU性能增速的比例达到10倍的情形下,CPU几乎已经无法直接应对网络带宽的增速。

“这个时代的核心变化是CPU性能增加赶不上数据产生的速度。2018年前,我如果买一个24核的CPU,有2个核处理流量,还有22个核可以处理上层应用;2018年后流量快速增加,需要16核处理流量,处理其他任务的只有8个核,几乎2/3就废掉了。”边缘智芯首席架构师李甫告诉第一财经。

在大型数据中心,流量处理占了计算30%的资源,AWS将这些还未运行业务程序,先接入网络数据就要占去的计算资源称为“数据中心税(Datacenter Tax)”。

DPU最直接的作用是作为CPU的卸载引擎,接管网络虚拟化、硬件资源池化等基础设施层服务,从而释放宝贵的CPU资源来运行上层应用,实现了以数据为中心的业务和基础设施操作的分离。

赛迪顾问发布的《2021中国DPU行业发展白皮书》将DPU方案分为三种:一是以通用众核处理器为基础,以多核Arm为核心,以众取胜,可编程灵活性较好,但是应用针对性不够,对于特殊算法和应用的支持与通用CPU相比并无太显著优势;二是以专用核为基础的异构核阵列,针对性较强、性能较好,但是牺牲了部分灵活性;第三种路线结合了前二者优势,即将通用处理器的可编程灵活性与专用的加速引擎相结合,正在成为最新的产品趋势。

大禹智芯CEO李爽告诉第一财经,目前DPU主流的市场方案包括以Arm核为主的架构、FPGA+CPU架构,以及SoC架构,前两者已经在云计算厂商得到批量部署,整体SoC方案则是今后的趋势,“我们自己的产品路线也按照这个来。FPGA+CPU的方案与第一代Arm核为主相比,接口的丰富度和处理性能要好很多,但是FPGA的功耗较大、价格较高。与此同时,我们的SoC项目已经启动。”

百家争鸣的格局

由于目前DPU的概念和技术标准并未统一,各家从自身优势出发输出相应的解决方案,形成百家争鸣的竞争格局。

一方面,英伟达、英特尔、Marvell、博通等全球芯片龙头积极布局,设立自己的标准;另一方面,众多创业公司加入这一蓝海。与此同时,包括AWS、阿里云等各大云服务厂商都在布局自己的数据处理器。

据第一财经了解,全球最大云服务厂商AWS采用的是以Arm核为主的方案。2015年,AWS收购了Annapurna Labs,后者是为超大规模数据中心和边缘计算设计基于Arm架构芯片的厂商;2017年,AWS正式推出Nitro,将网络、存储和安全任务卸载到基于Arm架构的专用设备上。

而阿里云提出的X-Dragon系统架构核心MOC卡采用的则是FPGA+CPU的形式。有业内人士表示,微软早期采用的是纯FPGA的方案,目前也在往FPGA+CPU方向转。

除了自研,云厂商也通过投资等方式寻找合适的解决方案。例如,腾讯投资云豹智能,字节跳动投资云脉芯联。

头豹研究院预测,2025年全球DPU市场规模将达到135.7亿美元,中国DPU市场规模将达到37.4亿美元。

赛迪顾问的数据更乐观。该机构预计,全球DPU市场将在2023~2024年迎来爆发式增长,中国早于全球市场,于2022~2023年就将迎来爆发式增长。预计到2025年,全球DPU产业市场规模将超过245.3亿美元,中国DPU产业市场规模将超过565.9亿元。

有业内人士认为,DPU数量会和服务器数量一个级别,每台服务器都需要1个甚至多个DPU产品。

巨头争霸

2020年10月,在收购Mellanox后,英伟达发布了首款DPU产品——BlueField2系列。英伟达创始人兼CEO黄仁勋表示:“现代超大规模云正在推动数据中心的新架构。需要一种旨在处理数据中心基础设施软件的新型处理器来卸载和加速虚拟化、网络、存储、安全和其他云原生AI服务的巨大计算负载。BlueField DPU的时代已经到来。”

英伟达规划了多代产品,计划在2022年推出性能更强的BlueField3,2024年推出集成其GPU模块的BlueField4。

从战略上,英伟达收购Mellanox推出DPU,并试图收购Arm,加上其传统强项GPU,将侵蚀英特尔的市场份额,直接威胁后者在数据中心的霸主地位。

股市上的表现更加直接。2020年7月,英伟达市值超过英特尔,成为全球第三大半导体企业;一年多后的今天,英伟达成为全球市值最高的半导体企业。截至北京时间12月28日,英伟达市值7736亿美元,几乎是英特尔(市值2112亿美元)的4倍。

不过,英伟达是否能成功复制其在GPU上的成功仍有待观察。有业内人士告诉第一财经,此前Mellanox产品在云服务厂商的认可度并不高,“它的劣势是它确实不太懂(云),包括客户对它产品的测试和设计都有吐槽。在Mellanox尚未被收购前,我们有测过很多功能,一些功能的改变也是我们提的。”

不少人认为,英伟达对DPU市场的教育和推动概念的作用要大于其产品的实际应用。

在英伟达的步步紧逼下,英特尔自然也不甘落后。2021年6月,英特尔发布了IPU(Infrastructure Processing Unit,基础设施处理器),对标英伟达的DPU,并推出了基于FPGA和ASIC的两种方案。

英特尔公司数据平台事业部首席技术官Guido Appenzeller介绍称,在美国和中国,六大云服务厂商目前使用基于FPGA的IPU。“随着带宽变高,我们看到它们缓慢地转向专用ASIC IPU。因为存在很多专利协议,所以不会发生快速转变。”

通过使用IPU,可以从服务器卸载与运行基础设施任务相关的开销。云服务厂商的软件在IPU本身上运行,而租户的应用程序在服务器CPU上运行。这不仅释放了服务器上的资源,同时优化了整体性能,而且为云厂商提供了一个单独且安全的控制点。

值得一提的是,英特尔的ASIC版本IPU采用的CPU核是Arm架构,而非其自身的X86架构,这意味着英特尔的话语权正在减弱,为了迎合客户需求选用了竞争对手的架构。

第一财经了解到,英特尔ASIC版本IPU主要与谷歌合作,谷歌提出相应需求,英特尔为其“定制”。

李甫认为,IPU侧重多个CPU的管理,努力融合IaaS模块,降低集群管理成本,更多像是一个协处理器。“类似在CPU中的大小核,变成了双路服务器中的双路大小CPU架构。为了应对不同客户需求,英特尔可能会采用‘FPGA+小CPU+大CPU’的超异构计算模型,复杂化DPU/IPU市场。我们推出基于PCIe Switch总线交换技术的XPU芯片,正是为了这种超异构计算架构准备的通用数据分发芯片。”

除此之外,赛灵思、Marvell、博通等老牌芯片厂商也都在推出针对数据中心的解决方案。

国内创业公司遍地开花

国内初创企业也陆续推出相应的解决方案。中科驭数自主研发KPU芯片架构,落地于金融计算、数据中心、云原生、5G边缘计算等场景。该公司正在研发的第二代DPU芯片K2已经完成设计和验证工作,预计将于2022年第一季度投产流片。

2021年,大禹智芯完成第一代产品的研发、客户测试和商业化交付;第二代产品即将发布;2021年年底,大禹智芯启动了自有芯片(SoC方案)的研发。

12月15日,云豹智能发布全功能云霄DPU网卡,全面支持裸金属、虚拟机和容器服务资源一体化和性能加速,主要基于FPGA方案。据悉,下一代软件定义DPU芯片也正在按计划研发中。

以PCIe交换芯片为主打产品的的边缘智芯则提供了另一种视角,数据从网卡进入其设计的XPU后,分发给CPU、GPU、SSD。按其架构,在XPU为中心的架构中,网卡无需智能,只需要提供基本的网络协议功能即可,适用于低成本、低延迟的应用场景。

与CPU和GPU不同,DPU目前在技术标准和生态方面都处于早期阶段,并未出现绝对的领先者。接受采访的多位业内人士认为,中国具备丰富的数据资产,有强大的互联网产业,在这一赛道中,中国芯片厂商或许有望脱颖而出。

马斯克旗下SpaceX再筹3.3亿美元资金:之前估值已达千亿美元 5000人夜排抢玩偶 迪士尼营销的锅?
相关阅读: