撰文/牛耕
编辑/赵艳秋
今年夏季,美国芯片大厂英伟达和AMD的股价分别达到历史最高点,对应5600亿和1300亿美元市值。而市值狂飙的原因,在于人工智能、自动驾驶和数据中心的计算都离不开他们提供的GPU。根据统计,这两家公司垄断了全球独立GPU 99%的市场。
但有一群人,已经走在了挑战这两家大亨的路上。他们创立了三家国产GPU公司:沐曦、摩尔线程和壁仞科技,希望做出自主的产品,有一天能从英伟达虎口夺食。
对于这群人,投资者也给予了极大信任。在没有任何芯片的情况下,就有几百亿元在两年内砸进三家公司。AI财经社获悉,三家公司中的两家将在近期开始流片(试生产),一家还在推进中,万里长征已经迈出第一步。
市场对国产GPU需求迫切
“客户非常急迫,恨不得现在就有产品给他用了,而且不是一两家,是所有客户都是这个状态,因为现在没有其他可选了。”沐曦创始人陈维良如此形容国产GPU的受欢迎程度。摩尔线程人士称,未来很多GPU应用,比如自动驾驶汽车和数据中心,都需要国产软硬件支撑。“我们盼星星盼月亮,就盼国产通用GPU能有一些突破。”有客户说。
在最初被发明出来时,GPU只用于游戏,去完成高难度的游戏图形渲染。但后来人们发现,GPU比CPU更擅长处理并行而简单的计算工作,于是开始发掘GPU的通用计算潜能。后来,从高性能计算到多媒体,再到火爆的人工智能,GPU都是底层“算力”不可或缺的一部分。例如,人工智能计算要用到大量的矩阵乘法和卷积,都是GPU擅长的事情。
到如今,英伟达和AMD已经垄断了全球的独立GPU市场:在数据中心分别占据81%和19%,在PC端则与英特尔共占99%市场。这让部分客户苦不堪言:“英伟达的GPU价格贵、极度缺货,而且很多计算中心还有国产化需求。”
但既然这么有需要,为什么国内芯片企业过去不做?“因为GPU的软硬件系统技术门槛比较高,是很复杂的系统工程。”有国产GPU人士说。国内的科技巨头往往选择开发专用AI芯片,比如华为昇腾、百度昆仑和阿里寒光,而不是通用GPU。形象地说,专用AI芯片更像专业技工,解决专门的问题,而通用GPU则是通才。
“通用GPU的难度体现在复杂度上面。”陈维良解释说,对于专用AI芯片来说,只明确知道需求,把相应的功能实现就可以。但通用GPU需要适配各种环境,面对灵活多变的需求。“换句话说,它有一套计算机体系结构所有的东西,包括支持的指令集、计算调度、数据搬迁等。”
有芯片人士告诉AI财经社,在过去造国产CPU时,国内公司最初依托海外的指令集,在对CPU产品设计、市场需求和生态的理解上,是通过磕磕绊绊的很多弯路才获得的,20多年才建成了如今国产CPU的格局。但国产GPU不必走这样的弯路,因为几家公司的创始成员都是GPU行业老人,深谙产品、市场和生态规则。
实际上,三家国产GPU的领军人物,也主要来自英伟达和AMD两家企业。沐曦的创始人陈维良是AMD图形研发高级总监,CTO杨建是AMD Fellow(最高技术岗);摩尔线程创始人张建中是英伟达副总裁;壁仞的联席CEO李新荣是AMD全球副总裁。
“我们能清楚地说出,过去10年哪些世界上最高端的GPU是我们主导做出来的。”陈维良说,正所谓难者不会,会者不难,由于是资深行业人士,他们清楚每个环节需要什么技能,要克服哪些难点,“再做一颗对我们来说并不是什么问题。”
制造出硬件只能算第一步。为了让各行业应用能用上GPU,就需要建立软件生态。英伟达从2006年开始培育CUDA生态,然后培育开发者来开发应用,比如华尔街的金融人士,或者中国的高性能计算和电竞人士,通过漫长的10余年时间,构筑起一道护城河,即使其他公司做出水平相当的硬件,软件开发者也不会轻易迁移。国内的一部分AI专用芯片,就因为与CUDA生态不兼容,遭遇了“有人造,没人用”的难题。
对此,国产GPU打算用“兼容CUDA生态”的方式解决问题。“就像不同公司的GPU没有统一指令集,为什么都可以玩游戏?因为是在API(应用程序接口)层次上兼容的。”陈维良表示。例如AMD在做ROCm生态时,通过兼容CUDA,只用两年就站稳了脚跟。摩尔线程也计划采用同样做法。树立在国产GPU面前的生态高墙,并不如国产数据库或国产CPU那样难以逾越。
看到了翻越几座大山的清晰路径,让国产GPU的创业者更坚定信心,去做国产GPU公司。更可贵的是,国内需求对国产GPU的崛起提供了宝贵的支撑和机会窗口。
终有一天挑战英伟达
搅动GPU市场的,一方面是新需求的出现,能容纳更多公司;另一方面是国产化给中国公司提供了一个机遇。
过去英伟达和AMD形成双巨头垄断的格局,部分是由于传统GPU市场增长停滞。“做游戏或电影渲染的传统GPU市场就那么大,增长速度太慢,只能容纳下两家公司。如果打这块市场,就只能打价格战。”但一位资深业内人士称,开辟了人工智能等计算需求后,GPU市场就能容纳更多公司。有业内人士判断,全球几千亿元市场,至少能容纳四五家公司活下去。
在这种判断下,几家国产GPU公司都不约而同瞄准新兴计算市场,然后再逐步蚕食传统GPU的渲染市场。“通用算力是我们国家目前比较奇缺的东西,而很多团队在高性能GPU上恰恰有积累,已经跨过技术门槛。”有业内人士说。
另一方面,国产化的需求也给国产GPU开辟了一块宝贵的市场。一位英伟达前员工告诉AI财经社,“过去在英伟达,我已经实现了个人的财富目标,生活也很安逸。”但她加入国产GPU公司以后,每周都会自愿牺牲周末,去开拓市场。她认为自己是在参与国内科技的一项重大突破。朋友跟她说,自从换了公司,她整个人都有如新生。
根据平安证券的预测,到2024年,国内互联网和安防/政府需求将占到整个GPU市场的48.9%和31.4%。“大家都越来越重视信息安全属性,尤其是对安防和智能汽车这些数据。”
陈维良预计,沐曦能够在5-6年内完成阶段目标,即做出GPU、兼容生态、实现量产,并占领国际5%-10%市场。“在服务器市场要实现5%-10%的增长很慢,但一旦突破10%,那就是势不可挡。”此后国内GPU将有资格跟英伟达和AMD同台竞争。
在这些目标里,从0到1的增长是比较容易的一步,因为很多国内人才都做出过量产产品。“国内GPU领域的从业者,不乏有几十年工作经验的,可以在工程上有很大的突破,靠完整的经验把产品做出来。”陈维良说。
但真正难的是从1到100的增长过程。多位芯片人士都表示,这一阶段,中国GPU企业必须走向国际竞争,去跟英伟达和AMD抢食。这时,更多需要企业的人才储备、技术投入和趋势预判。“但对于比较底层的前沿创新和研究,我们还有相当大的距离。”他说。
另一位芯片人士告诉AI财经社,AMD光是在中国的研发团队,就有大约2000人。这比三家国产GPU企业的员工总和还多。要在国际市场上超越英伟达和AMD,还有很长的路要走。
好在英伟达和AMD也力有不逮。有国产GPU人士透露,英伟达有比较明显的服务不到位问题,对小客户非常明显。
而且,中国是GPU需求最前沿的市场。此前英伟达创始人黄仁勋每年都要飞来中国几回,听中国团队汇报前沿需求。比如通过电竞推广高端显卡的主意,就是由中国团队发现,然后上报给美国总部的。而土生土长的中国公司,也会在捕捉新需求上“近水楼台先得月”。
尽管挑战英伟达之日尚远,国产GPU人士仍相信,自己是在参与一项科技发展的伟大征程。“我们成立只有一年,从最初几个人到现在几百人,每一天都非常充实,非常有成就感。很多年后,回头再去看这段时间,应该会觉得是这辈子过得最值得的事吧。”一位人士称。