股吧交流

新闻 公告 提示 股吧

GB300未来两周最大题材

用户:用户:西雅xuryxxu 时间:03月07日 14:26

英伟达GB300最值得关注的变化——GPU Socket(插座)

关于英伟达下一代AI GPU芯片B300/GB300以及对应的服务器,此前市场已经流传有多个潜在的变化方向,包括超级电容、氮化镓电源、PTFE中继板等,这些新方向大多是关于GB300服务器的新变化,并不是GPU芯片本身。市场较为忽视的一个重要变化是GPU Socket(插座)。虽然有关Rubin平台GPU将采用Socket与主板连接的传闻也并不新鲜(早在去年10月已有外媒报道),但多数投资人似乎并未足够重视这一传闻,可能部分原因是对专业术语的陌生。事实上,Rubin如果采用Socket,其变化非常显著、直观,且意义重大。我将尽可能简短地介绍这一潜在变化,并讨论其意义。



1. 什么是芯片Socket?



Socket可以简单理解为将芯片固定、连接到主板的一个连接装置。另外一种连接装置是Slot(插槽)。对于了解个人电脑硬件或有过装机经验的朋友而言,Socket其实并不陌生,现代几乎所有主流CPU都是通过Socket与主板连接,甚至Socket一词一般默认就是CPU的插座。





上图就是一个典型的CPU Socket(CPU并未安装上去),Socket的底座有密集的pin针(或触点),上方是固定装置。在CPU芯片的背面也会有同样密集的引脚(见下图)用于与Socket连接。





2. GPU与主板的连接方式变化



在AI大模型兴起之前,GPU一般被视为一种加速卡/拓展卡,在电脑或服务器的主力芯片CPU之外提供游戏图像处理或视频编解码加速等功能。因此,不同于主板上一般有专门为CPU设置的槽位(也就是Socket),过去主板上一般并没有专用于GPU的位置,而是设置有通用的插槽(Slot),GPU首先被做成板卡(板卡上还要封装VRAM等),然后整块板卡通过金手指(connecting finger,显卡与插槽的链接器件)插入插槽与主板连接,见下图。







消费级GPU一般采用普通PCIe插槽与主板连接,过去的AI GPU也是如此。但是后来英伟达推出了一种新的连接方案SXM(Server PCI Express Module),性能强于PCIe。这种连接方式主要用于英伟达自家的HGX/DGX整机,如果是自己买卡组装服务器,那么一般还是会买PCIe接口的,因为更通用。同一款芯片SXM版本的性能强于PCIe版本,而且互联性能更好:





SXM的本质我个人理解是不用传统的PCIe插槽,而是专门设计一个用于SXM模组连接的SXM插座。某种角度看其实也可以算是一种Socket连接,因为主板上专门留有给SXM模组的连接装置,使得GPU与主板的贴合更加紧密稳固。但是这种连接依然是基于板卡,而不是芯片(简单来说,你不能单独把GPU芯片拆下来,而且依然要先对GPU芯片在一块板子上集成,然后再连接至主板)。下图右上方是两个已经安装了GPU的SXM Sockets,右下方是一个没有安装GPU的SXM Socket(这张图可能来自一张技嘉H100 SXM主板),可以看到往SXM Socket安装的是整块SXM模组,包括GPU芯片,也包括VRAM(或HBM)等。





B300/GB300传言的采用Socket连接指的是什么?不可能是指这种板卡级别的连接,因为英伟达早就采用了。而应该是指芯片级别的连接,即未来可能可以直接拆装独立的GPU芯片。



例如,当前的GB200芯片是由台积电在生产出芯片后采用SMT封装工艺直接将芯片焊在Bianca板上,芯片不能直接从板上拆卸下来,也没有引脚。比如大家看看英伟达发布的GB200的图片,两块GPU芯片和一块CPU芯片都是被焊在同一块板子上,这才共同组成了GB200超级芯片,无法单独拆下其中一块GPU或CPU芯片。





这种方式固然有其好处,比如连接、供电性能更好,但是也有一些明显的缺点,包括需要SMT工艺流程,无法拆卸、不利于维修,主板设计复杂等。而如果转为采用Socket连接,可能会损失一小部分显卡性能,但是使得显卡可以灵活拆卸,主板可以重复使用,而且更多硬件厂商可以设计、生产自己的主板,而不是依赖目前英伟达指定的几家主板生产商。



3. 从GB200到GB300



去年12月,SemiAnalysis的分析认为对于GB200,英伟达提供整块Bianca板,其上包括GPU、CPU、DRAM等,见下图。这种板卡因为定制程度高只有纬创、富士康等少数几家和英伟达深度绑定的厂商可以生产(也正因此,如果纬创、富士康进度慢,整个GB200的出货进度就慢)。





而对于GB300,英伟达只会提供一个“SXM Puck”,其他部分可以让硬件厂商自行装配。这就给了更多硬件厂商机会,也有利于整个GB300的生态发展和出货进度。





这里SemiAnalysis说的“SXM Puck”不确定是不是指Socket连接,但是背后逻辑和采用Socket连接是一致的,就是增强芯片拆卸以及服务器定制、组装的灵活性。



4. GPU Socket的意义



GB300如果采用GPU Socket,首先会开辟出一个新的市场,这个市场拍计算器可以拍得很大。因为当前的AI GPU相比CPU面积更大、对连接供电的需求更高,所以这里的Socket连接设计对于芯片背面的引脚和主板上的pin针都会提出更高要求,单价可能相当可观。



此外,采用GPU Socket在我看来具有更深远的意义,其背后反映的不仅仅是一代产品的某个特殊设计,而是一种可能有持续性的产业趋势。



在前AI时代,CPU一直都被认为是服务器的主力芯片,因此服务器主板围绕CPU为核心设计,只有CPU能够以Socket形式直接在主板上安装、拆卸。GPU必须要先被封装成板卡,然后再连接到主板上,板卡上的GPU芯片是不可拆卸的。



在AI时代,GPU在AI服务器中的地位高于CPU,整个服务器硬件设计特别是主板的逻辑可能从CPU为中心转向GPU为中心,因此,GPU采用Socket连接也就成为可能。当然这种连接显然存在挑战,整个主板上的其他部件、元件可能都要围绕GPU而不是CPU展开重新布局。





这里我们也就不需要纠结于NV的远期格局之类的问题(比如DeepSeek火起来后,有人争论NV卡的需求,有人争论NV大机柜的需求),因为NV如果决定采用GPU Socket,那么大概率是反映了未来GPU与主板连接模式的范式转变,其他芯片、服务器厂商也有可能跟进效仿。


注:此文仅代表作者观点