| |
|
知识库 -> 数码 -> 为什么英伟达的显卡显存都没办法做大? -> 正文阅读 |
|
[数码]为什么英伟达的显卡显存都没办法做大? |
[收藏本文] 【下载本文】 |
rt,现在为了跑ai各家都在拼命买英伟达的显卡,但英伟达的显卡显存都不是那么高,相比之下苹果金子一样的内存都变得极具性价比了。如果英伟达的显存能做的和… |
![]() |
最新的 GDDR6 16Gbit 颗粒报价是 9.5 美元,要组成 16GB 大约是 76 美元。 如果是使用 8Gbit 来组 8GB 则是 23.2 美元,两者差距大约是 53 美元或者说 385 元人民币。 显卡厂商不至于做慈善直接把颗粒按原价卖吧。 我很早以前曾经和 NVIDIA 的人讨论过毛利率的问题,他们认为,对 NVIDIA 而言,低于 40% 的毛利率就有可能产生诸如经营性亏损等财务危机. 这个说法是有可能成立的,像 AMD,我记得他们的游戏卡部门毛利在 30% 左右的时候显卡业务就是亏损的,其实现在 AMD 的游戏卡部门经营状况也是很一般。 这个说法成立的话,那么我们假定这个毛利率定在 70%,这额外的 8GB 显存需要增加的价格大约是人民币 1284 元。 我的计算比较粗糙,也没啥具体的根据,仅供参考。 |
这个问题不复杂,但是解释起来需要具备一定的基础芯片知识。 根本原因是对存储芯片来说,容量和速度是两个此消彼长的东西,如果再加入空间占用,那就更是复杂,而这之上我们要是再引入成本,那就是非常难说清了,我曾经在另一篇回答里面解释过为何苹果的内存金贵:Ryan Woo:MacBook Pro 升级内存为何那么贵? 现在我们不主要考虑成本,就单单从存储芯片的容量,速度和空间占用来解释。 现在由于 AI 的井喷,很多人转过来问为啥老黄的显存又比苹果的统一内存贵。最近刚刚泄漏的 NVIDIA RTX PRO 6000 "Blackwell" 显卡拥有高达 96G 显存,考虑到它的前代 RTX Ada A6000 48G 的价格高达 $6000: |
![]() |
我们可以推测 Blackwell 版 RTX PRO 6000 的价格不出意外,应该在 $8000-10000 的位置,这可能比满配 512G 统一内存的 M3 Ultra Mac Studio 还贵: |
![]() |
其实说到这里,大家估计也看得出来了,聊苹果和 PC 价格差异的时候我们用的名词是“内存”,或者准确的说是“统一内存”拉高了苹果的价格,而这里面对老黄的显卡和 Mac Studio 时,我们说的其实是“显存”。显存其实就如同其名字:Graphics DDR 图形内存,其实就是内存针对显卡应用的特性化内存。而苹果的设备其实还是用的内存,只不过也是比较特殊的高速内存多通道并联使用。 因为这个问题问的其实是为何显存无法做到苹果的统一内存大,所以我就直接说原因了:技术限制 具体在,如今的技术很难在芯片和板卡面积有限的情况下,做到高传输带宽的同时,确像内存一样拥有大容量。 首先我们说带宽,显卡的显存到核心的带宽一般是数百GB/s 来计算的,我们拿一个最常见的显卡 4060 来说,它的关键指标其中之一就是显存吞吐数据的带宽,使用 GDDR6 显存,128bit 位宽的情况下,下图已经显示出来带宽是 335 GB/s: |
![]() |
而我们常见的内存是什么带宽呢?其实即便是如今高端桌面用的 DDR5 6400,带宽仅有 51G/s 而已: |
![]() |
当然这是单通道的数据,如果你是稍微懂点电脑的用户,都知道一般 PC 至少会是双通道内存组,所以大约理论带宽其实是 x 2,大约在 100G/s,那么我如果要继续增加带宽怎么办?你可能很快就能想到:加通道数呗,这就是服务器 CPU 做的事情,而且加通道不仅能增加带宽,也能提升容量上限。例如双通道的台式机普遍可以做到使用 128G 上限的内存,通道数更大的服务器就能加到 512G 甚至 1T 的程度,这样能显著提升带宽和容量,例如下图就是服务器 AMD Epyc CPU,插满 12 通道可以做到 460G/s 的带宽 : |
![]() |
说到这里,你也许就开始兴奋了,既然内存也可以做到这么快,为啥显卡显存不增加容量呢?还记得我说的服务器 CPU 吗?这是它插满 12 通道内存的样子: |
![]() |
而这是它的芯片在手上的实际大小: |
![]() |
这告诉我们两个信息:为了支持 12 通道内存,Epyc 使用了12个内核,正中间的 IO 核心控制着 PCIe 接口和内存控制器,而其 IO 核心的设计和功能规划是这样: |
![]() |
如此巨大的一颗芯片,有1/5 的晶体管在做内存相关的控制。 所以我们从物理角度来考虑: 高通道数,需要 CPU/GPU 集成大量的晶体管作为内存/显存控制器为了减小通讯延迟,这些控制器还得尽可能接近内存芯片而为了满足带宽的需求,必须每个通道都需要独立的内存条/芯片为了满足大量的带宽,我们得让内存芯片跑在更高的频率上 如果我们把内存带宽想象成高速路,而内存控制器想象成高速公路的收费站,而内存芯片的速度相当于高速公路的道路数目,那么一个首都都市区能支持的高速公路的数量是远远大于一个小乡村的,因为城市的边缘面积更大,能容纳更多的通道,而如今的显卡也正是如此,可以看见显卡核心的周边 3 面都已经堆满了显存控制器: |
![]() |
所以为了达到高带宽和高容量,需要的成本是非常大的,你不仅需要足够的显存芯片构成多个通道提升带宽,还需要大量的晶体管用在显存控制器上,而且为了减小通讯延迟,这些控制器还得尽可能接近显存芯片,而芯片周围的面积是有限的。而传统的 DDR4/5 桌面内存很难做到更快的速度,所以我们才有 GDDR6 和 GDDR7 以及 HBM 等高速内存芯片。 这时我们再去看显卡:能在这样小的一张电路板上,用不大的核心和显存芯片来支持高达 300G/s 的带宽,已经是非常不容易了,所以显卡这种特化的产品,往往只能兼顾带宽和体积的同时牺牲掉容量。 |
![]() |
而如果我们再考虑一下如今最快的 5090,高达 1800G/s 的带宽,但是实际板卡面积也不比上面的 4060 大多少: |
![]() |
5090 Astral 板卡: |
![]() |
这时你再回去用我们服务器的例子想想,如果要做到 1800G/s 带宽,用如今 DDR5 的技术水平,那估计需要 48 通道的内存,物理上妳把整个主板所有面积前后插满内存都不够。 所以到这里,你应该能理解为何显卡的显存很难增加容量了: 它们需要很高的带宽,就需要更特化的显存满足高速度,在成本和面积的制约下,就只能牺牲容量。 这就是为何在显卡上我们能看到 GDDR7 的首次使用,而桌面和服务器平台还在 DDR5 上缓慢爬坡。 现在我们再来看苹果,基于上面的讨论,你应该能理解苹果其实就是用技术做了一个适合自己的取舍,下图是苹果 M1 Ultra 的核心和 Zen 的对比,最新的 M3 Ultra 其实也大同小异: |
![]() |
你可以看见苹果首先用了两块超大的核心来提供足够大的周边面积去支撑大通道的内存控制器,每一个 Ultra 是两个 Max 芯片的拼接,它们也刚好有三面可以用来链接内存芯片。 至于内存部分,其实是用了 8 个内存芯片物理上构成 16 通道才能达到 800G/s 的带宽,这种设计可以说是兼顾了显卡的带宽需求和内存的容量优势: |
![]() |
看似原理简单,就是堆料,但是物理上,可以说这样做的仅此一家,因为每一个内存芯片,你看的部分只是封装的芯片,其内部是几十层的堆叠才能做到每个颗粒 64G 的巨大容量,因为需求小,这样的配置也并不便宜,只能说比用 GDDR 显存便宜点。 同时这里你也能看出来,苹果虽然可以用 GDDR 显存获取更大的带宽,但是这样没必要,因为苹果的 GPU 处理器能力有限,用不到这么大的带宽,因为其实际计算性能也就在 4070 的水平,给 800G/s 带宽已经非常够用了,所以采用普通的内存LPDDR5 成本也更低,这也是为啥 Studio 既能做到容量巨大的同时,还能保持对显卡的成本优势。 如果你继续问为何显存不提供大量的堆叠从而增加容量呢?这就涉及到物理规律了:内存芯片是半导体同样受制于功耗和发热,当你追求运行频率的大幅提升,增加芯片带宽时,它必然会有更大的发热,从而很难增加堆叠的层数,相较于 CPU,内存芯片的设计好歹重复性比较大,结构的复杂性低于 CPU,所以堆叠还能继续做,但是依然受限于当今的光刻机极限和成本,而如前所述,在 AI 爆炸以前,确实不太需要大量的显存集合在一张显卡上,所以 GDDR 这个显存分支,过去是不注重提升容量的,至于以后会不会有内存厂商发力,我个人估计应该会迎来一个小爆发。但是短期内,苹果的统一内存折中做法应该是一个不错的方向。 所以无论是最顶尖的显卡还是苹果的 Mac Studio,其实都已经尽全力去用最新的技术来提示自己的产品价值,只不过方向有所不同而已。苹果需要考虑自己 AI 虽然能提供大量的统一内存当作显存使用,但是带宽并不高,而 GPU 核心的性能也远不如 Nvidia 的显卡。另一方面 Nvidia 虽然有更强的核心,更大的带宽,但是显存容量是个硬槛,而且新的 GDDR7 也并不便宜,技术远没到成熟,产能也没最大化,在此基础上能把最新的游戏卡做到 32G,A6000 做到 96G 已经是极限,再往上只能靠 Nvlink 串联显卡来实现更大的虚拟显存容量。 就像任何事物一样,性能和容量都是互相制约的变量,而现实中我们还得加上体积和成本的考量,单纯意义上的只比较容量这一个数据,其实是刻舟求剑,结果也是南辕北辙。 |
你说的英伟达消费级显卡吧。 消费级显卡,顾名思义,就是给臭打游戏准备的。 说白了卖这种显卡赚不了啥钱,甚至四舍五入等于亏钱给游戏玩家做显卡。 毕竟少赚钱等于亏钱,大家不都这么算的吗? 你一个打游戏的要那么大显存干嘛? 至于跑AI的生产力级别的显卡。 比如deepseek,好像用了2000张的H100还是啥AI卡。 支持老黄家的显卡桥接,即SLI技术。 每张80GB还是96GB显存。 粗略算一下。 也就是160TB的显存。 再加一点就是1PB显存了。 你先看自己硬盘有没有这么大再说吧。 当然,老黄靠这个也赚的盆满钵满。 自己吃肉吃饱了,经销商一点汤没喝。 经销商也要恰饭啊,所以50系显卡缺货+官方渠道黄牛抬价,老黄都默许了。 不对啊,我怎么感觉还有很多品牌也是这样的。 |
老黄知道打游戏的斤斤计较,在乎性价比,多用点显存就涨价就心痛了。所以只定个70%毛利率。 老黄也知道搞大模型的人的钱好挣,定个95%毛利率都没事。 谁让咱们塔尖上的明珠还缺那么几块呢 哪天摩尔线程奋发努力了,把96G以上显卡普及了,老黄估计也能良心降价了。 |
谁和你说做不大了,H200 141GB显存啊。 哦,你说游戏卡? 游戏卡做大了那贵上天的计算卡怎么卖你告诉我。 |
臭打游戏的给那么多显存不是影响自家计算卡大哥的销量吗? |
因为老黄想的是游戏卡业务就游戏卡,没有想到大家用游戏卡去炼丹。 |
512G?臭打游戏要这么大显存有用? |
因为有好几款显卡,不能内部打擂。 |
|
[收藏本文] 【下载本文】 |
上一篇文章 下一篇文章 查看所有文章 |
|
|
娱乐生活:
电影票房
娱乐圈
娱乐
弱智
火研
中华城市
印度
仙家
六爻
佛门
风水
古钱币交流专用
钓鱼
双色球
航空母舰
网球
乒乓球
中国女排
足球
nba
中超
跑步
象棋
体操
戒色
上海男科
80后
足球: 曼城 利物浦队 托特纳姆热刺 皇家马德里 尤文图斯 罗马 拉齐奥 米兰 里昂 巴黎圣日尔曼 曼联 |
网站联系: qq:121756557 email:121756557@qq.com 知识库 |