2023-09-07 18:34:53 发布人:hao333 阅读( 5875)
集微网报道 一直善于乘借科技趋势“东风”的英伟达真的要赢麻了,从电子游戏热潮到加密货币崛起,从AI再到元宇宙,直至如今席卷全球的生成式AI热潮,让“乘势而起”的...
集微网报道 一直善于乘借科技趋势“东风”的英伟达真的要赢麻了,从电子游戏热潮到加密货币崛起,从AI再到元宇宙,直至如今席卷全球的生成式AI热潮,让“乘势而起”的英伟达的市值屡创历史新高。伴随着2024财年第二季度财报的发布,市值一度逼近1.2万亿美元。
如果说,英伟达性能逆天的GPU是其傲视群难的堡垒,那成熟且完善的平台生态CUDA则是其深厚的护城河。凭借软硬深度捆绑,英伟达看似已经建立起固若金汤的城池,难以逾越。
但在这座“大山”面前,除有数家大型军团如AMD ROCm、OpenCL、PyTorch 2.0等在发起冲锋之外,尚有产业新贵也在着力围攻。
前不久一家名为Modular的美国初创企业拿下一笔1亿美元融资,由知名基金General Catalyst领投,GV等机构参投。而Modular的目标是在AI软件领域推出一种替代方案,用来取代英伟达旗下成本高昂的CUDA平台。
英伟达的护城河将被逐渐削弱?
CUDA的堡垒与罅隙
CUDA的发迹,离不开黄教主的前瞻布局、巨量投入、紧跟风向、持续迭代。
经过持续的演进,CUDA已然形成了一个丰富而成熟的庞大生态,具有高性能计算能力、并行计算模型、高效数据传输、编程接口易用等优势,在科学计算、机器学习、深度学习等领域得到了广泛的应用。
更厉害的是,英伟达由此实现了软硬件深度捆绑:用他的软件就必须买他的硬件,买他的硬件那使用CUDA可事半功倍,他们相辅相成,相互促进,完美地诠释了什么叫1+1大于2。
毕竟,相较于要持续迭代的硬件,制程每前进一步就产生新一轮的擂台赛,有可能半路杀出个“程咬金”来成功截胡,但成熟的软件生态则构建了强大的用户粘性。
在AI领域竞争日益激烈的今天,英伟达的“GPU+CUDA”组合拳更是凌厉,打遍天下无敌手。
但在繁花着锦背后,英伟达的CUDA也不是没有隐忧。一方面,越来越稀缺的英伟达GPU资源,加之日益上涨的成本问题,限制了一些小型公司的发展。另一方面,英伟达渐成垄断之势,但客户也希望有其他供应商加入,以稳定供应链。
国内一家厂商代表施展就提到,英伟达建立的是一个封闭生态,只有使用英伟达的硬件,才能用上其上层的各种工具。国外这些初创企业着力构建新的开源算力平台,比较符合云厂商的利益,因此也会吸引一些投资和合作。
除初创公司Modular显山露水之外,其实已有一些先行者在行动。如AMD在2016年打造的基于开源项目的GPU生态系统ROCm,目前ROCm支持多种编程语言、编译器、库和工具,还支持多种加速器厂商和架构,提供了开放的可移植性和互操作性。最近,AMD发布了ROCm 5.6,通过针对大语言模型的新型AI软件附加组件增强了功能,包括跨ROCm 库组合的许多性能优化。
而OpenCL则以开源为利器,OpenCL支持多种编程语言和环境,并提供丰富的工具来帮助开发和调试,可同时利用CPU、GPU、DSP等不同类型的加速器来执行任务,并支持数据传输和同步。此外,OpenCL支持细粒度和粗粒度并行编程模型,可根据应用需求选择合适模型提高性能和效率。
撼CUDA难上加难?
但理想丰满现实骨感。
从战况来看,起步就晚的ROCm要想构建开发者生态还需要时间,而OpenCL可移植性有限,不同平台和设备的功能支持和性能表现存在一定差异,与 CUDA相比缺少广泛的社区支持和成熟的生态圈。其他厂商构建的算力平台生态也存在或多或少的问题,难以与CUDA抗衡。
一位业内专家也表示,英伟达CUDA的生态庞大、覆盖广泛,是很难在短期内真正做到所谓的“替代”的。
上述专家详细分析道,首先是软件工具:开发生态涉及各种库、开发工具、软件,这些东西的建设本来就不是一朝一夕的——光这部分工作,目前就没有任何一个竞争对手可以和英伟达相提并论。正是这些库、工具,成为简化开发的根本,在现有生态内替代英伟达很难。
其次这一“生态”不光是开发生态。在 AI 的大规模集群训练上,其实涉及设计、封装、互联、节点间的Networking等等,在这些方面几乎也只有英伟达提供了最全面、最高效的方案,生态粘性极强。不要说很难有AI芯片竞争对手比得上,其他耕耘算力芯片多年的对手也暂时难以比肩。
最后,即便抛开AI来看,在HPC通用加速如化学、生物等领域的生态层面,英伟达也在涉足专用的加速库。这种广度,基本也找不到第二家。面向特定领域写一个加速库,这个领域就立刻能发生翻天覆地的变化,相对来说别的公司很难有这种投入。
尽管新秀如Modular等公司的出现,或为行业带来新的选择,而且Modular志向远大,不仅要替代CUDA,还期望打造全平台开发工具,让编写的程序在不同厂商的GPU训练和运行,化解硬件与软件之间的阻碍,由此面临的挑战更甚。
施展提及,一是这些企业纯做软件,但软件是要跑在硬件之上的,涉及很多底层的协同开发,要对硬件架构逻辑有深入的了解,否则很难高效释放算力。二是每家都有自己的架构和技术特点,如果要达到普适,需要与众多硬件公司之间达成协议,还要考虑各平台之间的兼容,这都需要长时间的打磨,无法弯道超车。
国内走华山一条路?
反观国内,面向生成式AI、大模型的爆发式发展,选择兼容CUDA路线好似已成为一门“显学”。
但兼容CUDA或只能是权宜之计?
“走兼容的路线,虽然软件适配比较快,但存在一定的知识产权风险。如果国内厂商做大了,知识产权的风险或会加剧。而且CUDA本身也在不断迭代,依赖于CUDA就要不断调整,但国产GPGPU架构是否能完全匹配CUDA还要另说。因此尽管落地快应用快,但产品的上限基本也被锁定了。”施展分析说。
在此情形下,国内一些GPU选择了一条更难走的路,即另起炉灶。
“原创路线则是基于自有产品架构设计软件,好处在于上限会很高,会充分挖掘硬件的潜力,但不利之处在于厂商需要花很多的精力来做适配,还要吸引更多的客户来迭代,这会拉低硬件的落地能力和竞争力。而且客户也难以投入时间和精力打磨你的软件,他们更希望的是即拿即用。因而,一旦做了自创软件生态这个决定,则一定要走长期主义路线的,至少需要5-10年的时间和资金投入。”施展指出了这一条路的艰辛之处。
尽管看上去荆棘密布,但从当下的大环境来看,或许这是一条艰难但正确的道路。施展认为,当下CUDA已构筑了一大壁垒,在国外纯商业竞争的环境下,机会已然不多。因为软件的发展相当于滚雪球,用户越多,反馈越多,迭代就越快,竞争力更越强,然后更能吸引更多的客户,形成指数级的正向增长。
但从国内的情形来看却是必然之路。在大国博弈日趋复杂之下,某一天如果出现针对国内算力芯片软件的“断供”,这也意味着硬件将成为无源之水。
当前国内半导体产业面临技术和地缘政治的双重挑战,国家也从政策、资金、人才等多方面助力半导体业锻长补短、自立自强。施展表示,除芯片硬件要大力提升之外,构建自主的软件生态也是重中之重,国家也有多项政策鼓励和推动半导体厂商建立自主的软件生态,这为国内厂商提供了走一遍CUDA崛起之路的机会,相信久久为功必有所成。
相关阅读
RelatedReading猜你喜欢
Guessyoulike