万年历 购物 网址 日历 小说 | 三峰软件 天天财富 小游戏 视频推荐 小游戏
TxT小说阅读器
↓小说语音阅读,小说下载↓
一键清除系统垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放,产品展示↓
首页  日历2025  日历2026  日历2027  日历知识  | 每日头条  视频推荐  数码知识 两性话题 情感天地 心理咨询 旅游天地 | 明星娱乐 电视剧  职场天地  体育  娱乐 
日历软件  煮酒论史  历史 中国历史 世界历史 春秋战国 三国 唐朝 宋朝 明朝 清朝 哲学 厚黑学 心理学 | 文库大全  文库分类 
电影票房 娱乐圈 娱乐 弱智 火研 中华城市 仙家 六爻 佛门 风水 钓鱼 双色球 戒色 航空母舰 网球 乒乓球 足球 nba 象棋 体操
商业财经知识 科技 汽车知识 工程技术知识 时尚与穿搭 家居与生活 设计艺术知识
    
  知识库 -> 科技 -> 美国多家科技巨头承诺为数据中心自行供电并提供资金,背后动因是什么?将带来哪些影响? -> 正文阅读

[科技]美国多家科技巨头承诺为数据中心自行供电并提供资金,背后动因是什么?将带来哪些影响?

[收藏本文] 【下载本文】
Alphabet、微软、Meta、亚马逊和甲骨文签署了白宫的“纳税人保护”承诺,将为与AI数据中心相关的新发电能力和电网升级提供资金。责任编辑:张俊 …
先说个背景。
2025年底,宾夕法尼亚州蒙图尔县搞了一场规划会议,到场了300多个居民,为了反对塔伦能源在当地建数据中心。原因:过去一年,宾州电价涨了15%,
弗吉尼亚州更夸张,三年涨了50%到80%,有家庭已经在电费和医疗费之间二选一了。 2025年第二季度,全美大概有20个数据中心项目被叫停或推迟,涉及金额近千亿美元。
所以白宫让科技巨头签承诺书——你们自己的数据中心,自己搞定电力,不然又要产生新的斩杀线。
美国的电网的交付速度跟不上算力扩张的速度。 一个AI数据中心,从动工到运行可以压到12到24个月。但电网扩容、输电线路建设、并网审批,典型周期是3到5年。德州电力可靠性委员会(ERCOT)给的数据:2024到2025年间,数据中心提交的新增负荷申请高达数十吉瓦,同期成功接入的只有大约1吉瓦。
所以谁能更快搞定电力,谁就能更快把GPU跑起来。一个1吉瓦规模的AI数据中心,年化潜在收入是百亿美元量级。提前几个月上线带来的商业价值,远超自建电厂多出来的那点成本。 xAI在田纳西州孟菲斯,不到四个月建成10万块GPU的超级集群,完全绕开公共电网,直接部署超过500兆瓦的快速可移动燃气轮机。连设备都是租的,就为了再快一点。 所以,电力获取速度直接决定了大家在AI竞赛中的身位。
能玩得起”自建电厂”的是谁?微软、谷歌、亚马逊、Meta、xAI。这些公司要么现金流充沛,要么背后有足够深的资本支持。 但AI行业里还有另一批玩家:OpenAI、Anthropic这样的头部创业公司。 OpenAI去年的毛利率从40%掉到了33%,远低于预期的46%。Anthropic的毛利率也比目标低了10个百分点。算力成本失控是主因。
现在再叠加一个”电费自负”的政策环境, 自建燃气电厂的度电成本大约是公共电网的3到5倍。电力成本本来就占数据中心运营成本的50%到60%,自建之后这个数字只会更高。对于现金储备充足的巨头来说,可以消化的战略投入;但对于还在烧钱的创业公司来说,就直接挤压了本就微薄的利润空间。
要命的是供应链。2025年科技巨头基本扫空了美国燃气轮机的库存。你就算有钱,也不一定买得到设备。北美变压器的缺口达到80%,交货周期从6周拉到了3年。
过去,算法和数据是核心竞争力;现在,能不能搞定电力供应,也成为一个前置条件。 如果你是一家刚拿到B轮融资的AI创业公司,你要训练自己的大模型,你不仅要买得起GPU,还要解决这些GPU的电从哪来。而你的竞争对手,已经在自己的园区里盖好了燃气电厂。
为什么几乎所有巨头都选了天然气?因为天然气最快。 核电建设周期太长,风光储能无法支撑7×24小时高负载运行,高效联合循环机组虽然效率更高但同样无法满足”立刻上线”的要求。 谷歌在明尼苏达和德州的项目倒是做了一些突破——采用了Form Energy的铁空气储能系统,总容量达到300MW/30GWh,号称能撑100小时以上的超长时储能。这类方案目前还是少数,绝大多数数据中心的”桥接电力”靠的还是烧气。
个人的判断是,天然气自建电厂这条路,本质上是一个过渡方案。前期离网快速投产,后期逐步接入电网,电厂降级为备用电源。最终还是要靠核电(包括小型模块化反应堆)和长时储能技术来接棒。 特朗普政府设定了2030年前开工10座新核反应堆的目标,和西屋电气签了800亿美元的战略协议。微软重启了三哩岛核电站合作,亚马逊在核电站周边布局数据中心。方向是对的,但时间窗口至少还有5到8年。 在这段空档期里,谁的天然气电厂先建好,谁就先跑起来。
中国的情况和美国不太一样。电网是国有的,特高压输电损耗只有1.5%(美国私有电网区域损耗6%),”东数西算”工程把数据中心往贵州水电、海南核电这些绿电富集区引导,单位能耗比美国低40%左右。
大模型训练和推理的电力需求增长速度,在哪个国家都是指数级的。2026年2月国务院刚发了《关于完善全国统一电力市场体系的实施意见》,目标是2030年基本建成全国统一电力市场,重点完善容量市场和辅助服务市场。 这个文件的出台时机很微妙——恰好在美国逼着科技巨头自建电厂的同一时期。说明国内决策层也意识到了:AI带来的电力需求不是线性增长,现有的电力交易机制需要提前做好准备。
送礼物
还没有人送礼物,鼓励一下作者吧
1、去年中国新装机容量是550吉瓦,美国大概是130吉瓦,中国是美国的四倍多。
去年的发电量,中国超过了十亿度电,人类历史上的巅峰,美国四万多亿度电,不到中国的一半。
总的装机容量,中国大概是美国的三倍多一点。
美国电网的损耗率大概是中国电网的五倍多点。
再加上美国的电网多且分散,所以美国要为数据中心提供电力,只能依靠科技公司自己建设电站,现在美国那边搞小型核电站,就建在算力中心旁边,不需要并入电网,直接把电拉到算力服务器上。
2、现在的问题不是电力,而是即使美国科技公司们自己搞定了电力,这么巨大的投资怎么盈利?如果不能盈利,最后这些投资全都是一地鸡毛。
中国这边既有像豆包千问minimax、kimi之类的价格仅为美国同类产品1/5到1/10的大模型,还有像deepseek这样的开源免费的大模型。
这就导致美国科技公司的服务费没办法定的很高,除非美国把中国这边的科技公司全搞死,否则美国的投入怎么变现?
转一圈发现自建电厂比走电网便宜多了就搞笑了
老美天然气便宜的跟不要钱一样,结果电网还能卖出一块多一度的天价,可想而知里头肥了多少史密斯专员。与其继续交电网税不如把这个钱拿出来建天然气管道。
如果懂王真的开口子允许大量自备电厂存在,那根本不会有翻新电网这回事,反倒会催生无数光伏+天然气自备电厂的独立电网,废热还能用来给数据中心制冷。所以真正利好的是燃气轮机,而不是高压变压器之类的电网设备,因为发电厂出口电压撑死才20kv,多整几个配变并列运行就行了,根本不用买昂贵的110kv变压器和配套的开关设备。
这不是带来哪些改变的问题,这是大家不了解美国电力行业的特点。包括用电结构、定价模式、电源特性等一系列问题。
以下我将用最通俗的话来解释:
一、美国用电大头是居民用电
你没看错,全美居民年用电量约1.5万亿千瓦时,商业用电量约1.5万亿,其中居民用电略多。工业用电量仅1万亿。居民用电占比37%,工业用电占比25%。
对比看,中国人均工业用电是美国的1.5倍,但是美国人均居民用电却是中国的4倍。目前美国已经成为了全球独一档的民用电消费大国。
看到这里肯定有人问,美国用电干啥去了,咋用这么多?中国现在居民电气化率也不低了,为啥还是落后老美这么多?
美国居民用电主要有三方面。第一,空调用电约占美国家庭用电量的50%,占比最大。美国地广人稀,居民住宅主要以独栋建筑为主,热量交换快,热的时候全屋空调都要打开,冷的时候由于不执行且没条件执行集中供暖,所以空调也要全开。第二,美国家庭电气化率高,用电设备多。除了传统电器外。还有烘干机、大功率电烤炉、大容量冰箱。其中,很多跟美国人的生活方式有关。比如,虽然院子很大,但是不会在院子里晒床单晒衣服等,而是选择烘干。比如,不会像中国人一样频繁去菜市场买菜,而是选择一次性买很多,丢到和衣柜一样大的冰箱里吃一周甚至更久……
二、美国居民用电费用很高
已知美国人均居民用电是中国的4倍。在此基础上,美国居民电价大概在20-30美分之间(也有更便宜和更贵的),折个中,按0.25美元/千瓦时算。
虽说挣美元花美元、挣人民币花人民币,但一个美国三口之家电费=4500千瓦时/年*0.25美元/千瓦时*3=3375美元,在美国够买两个iPhone17promax 1T版手机,然后还有剩余。换言之,美国一个三口之家的电费,大于顶配苹果手机半年一换的消费力。库克看了都要哭晕在厕所,高科技不能make American great again 但是 power 可以(手动狗头)
为啥美国居民用电负担那么大?答案是:美国人民是美国历史的缔造者,是美国电力工业唯一的救命稻草。
又一个冷知识:美国商业电价>美国居民电价,两者均远大于美国工业电价。解释上面结论,涉及到美国电力市场的交易逻辑、定价体系、电费结构和洲间差异。这里我就不展开说了,第一是太复杂太麻烦,第二是我窥豹一斑。保守的说,把以上内容理顺说透了,够一个博士毕业三次。在这里我以美国马萨诸塞州为例,谈一谈美国居民电费结构。
在美国(或者加拿大)生活过的人都知道,普通人是根本看不懂也不可能看懂美国电费账单的。客观的说,想真正看懂美国电费账单,需要电气工程硕士研究生及以上学历。就为了给美国人科普电费组成,美国州政府搞了很多“科普文”,但是没有用。
假如你在美国麻省理工读书,恰巧又在周边租个了房子,那么你收到的电费账单里面可能包含20多项,如下:






注意,以上列举的并不代表上限,而是现行的,未来如果还有,那将再增加。
上面这么多内容,总结起来就是一句话:一切依靠美国人民,一切由美国人民买单。
比如其他输配费用中的第一项“分布式光伏费用”,这项费用依据是马萨诸塞州的一项地方法案,激励分布式发电的激励支出需要由用户买单。
比如正常费用中的第六项“养老金调整系数”,养老金缺口的一部分怎么收,用电费收。
比如正常费用中的第九项“风暴储备基金调整系数”。正常储备,用于支付风暴后的抢修维修支出,注意这笔钱不光是付给设备更换的,泛意上应该还包括抢修人员的工费。遇到天灾怎么办?当然是人民掏钱兜底。
其他的我也就不一一解释了,大家可以自己看,但是不推荐自己看,因为即使英语没问题,专业上的门槛也不低。再次回到我上面说的:想真正看懂美国电费账单,需要电气工程硕士研究生及以上学历。
三、美国科技巨头自行供电和提供改造基金,主要是美国的一场政治作秀
已知:
1.美国电费是居民一大笔开支。
2.美国人看不懂电费账单。
3.美国人知道美国用电紧张。
4.美国算力用电吹的天花乱坠(跟美国AI泡沫叙事有关)
在电力市场化环境下,按照边际定价原理,用电增加10%,电费可不是增加10%那么简单,可能增加的是50%。基于以上原因,引发了美国人民的普遍担忧,川宝精准把握美国人民爽点要求科技公司自己供电,也就是这整个事件的来龙去脉。
为什么是政治作秀,两个原因:
1.科技公司自己投资发电和局部电网,亏钱概率很小,无非就是赚多赚少的问题。因为算力中心选址可以跟着电源走,选址灵活性很高。且作为供给侧,在美国电力市场环境下,挣钱的手段还有很多。这是科技公司同意的根本原因。
2.美国算力叙事逻辑有问题,实际上现在美国算力用电占全美用电4%左右,华尔街资本已经对AI泡沫发出质疑了。制约美国算力的不是电力,而是资本。再砸那么多钱下去,不是电够不够用的问题,是投资人的钱耐不耐得住烧的问题。
最后总结一下:没什么新鲜事,太阳照常升起。
全球各公司用于先进数据中心交流/直流配电和转换电源架构的创新解决方案,特别关注人工智能/机器学习工作负载不断增长的需求,它强调了微电网在解决数据中心电源挑战中的关键作用,并提出了从电网到芯片的集成系统创新。这里本文将从未来供电架构展望、在考虑负载波动性的情况下,探寻效率、密度、稳定性和可扩展性以及数据中心能源中的关键问题。


High Voltage DC Arch - Enablers
该图表展示了一种多级功率转换架构,始于电网的高压交流电,将其转换为 HVDC,然后转换为中间直流电压(48Vdc、4-12Vdc),最后转换为数据中心中的 CPU 或 GPU所需的低电压。储能(BBU 和 CBU)表明该系统设计具有高可靠性和功率稳定性,这对于数据中心中人工智能/机器学习工作负载等要求苛刻的应用至关重要。反复提及 GaN 器件突出了对高效率和功率密度的关注,底部的电路图提供了 AC/DC 和 HV DC/DC 转换级的更具体示例,强调了多电平转换器和 LLC 谐振拓扑结构的使用,以实现高性能。
在整个链路中,Isolation,电压隔离是一个很重要的挑战:
下图把四类典型的“隔离架构”放在同一张对照表里,从应用场景、器件应力、效率与成本等维度,梳理了各自的优势与痛点。在满足安全隔离与法规约束的前提下,如何在功率密度、系统可靠性和可扩展性之间做出最优折中。


Isolation Arch
四种隔离架构对比[其中三次谐波是通过不同相序变压器消除]
对比项方案 1方案 2方案 3方案 4架构图示(概念)PFC → 带隔离模块 → 48V 分配(单级,输出隔离)PFC → 专用隔离模块 → 48V 模块(两级)类似方案 2,但隔离级输出为 ±400V 平衡母线,再给 48V 模块供电(可能中心抽头接地)PFC → 隔离模块 → ±400V 母线 → 带隔离的 48V 模块(方案 3 变体,隔离更靠前)三次谐波电流复杂控制消除隔离消除隔离消除隔离消除电源电缆2 根电线2 根电线3 根电线(地线承载负载电流,可能影响电流分配与效率)2 根电线(优于方案 3)浪涌(对 IT 机架隔离)浪涌事件未与 IT 机架隔离(缺点)隔离屏障提供额外保护(改进)隔离屏障提供额外保护隔离屏障提供额外保护爬电距离与电气间隙最大(缺点)第二大(好于方案 1,但非最优)最小(显著改进)最小(类似方案 3)直流母线保持时间(Hold-up)否是是是电源并联可能是是是高压直流热插拔器件1000V 器件1000V 器件2 × 500V 器件(单器件电压应力更低)1000V 器件
在 IBC 中,接地与隔离都能降低对爬电距离和电气间隙的要求。
如下是一个30kW AI Server PSU架构图:


30kW AI Server PSU
以下是各种三相结构和成本对比:


三相结构和成本对比成本项2L Converter维也纳整流器3L Flying Cap3L NPC3L ANPC3L T-Type功率开关管 (Power Switches)27%25%27%35%38%41%无源器件 (Passives)46%21–26%21–26%21–26%21–26%21–26%电解电容 (Electrolytic cap)17%7–17%7%7–17%7–17%17%半导体器件 (Semiconductors)20%21%32%30%32%25%
注:无源器件与电解电容在部分拓扑下仅给出区间(21–26%、7–17%),表格中以区间形式呈现。
数据中心电源挑战 (Data Center Power Challenges):
有限的电力容量挑战 (Limited Power Capacity Challenges):电力基础设施难以满足数据中心日益增长的需求。这意味着随着数据中心规模的不断扩大和计算密度的提高,现有电网的供电能力可能无法跟上。ML 负载波动 (ML load fluctuations):人工智能/机器学习负载的波动性会给整个电力系统带来扰动,并可能对发电机造成巨大的机械应力。AI/ML 工作负载通常不是恒定的,而是会有周期性的高峰和低谷,这种快速、剧烈的功率变化对电网的稳定性构成挑战。公用事业更严格的互联要求 (Utility tighter interconnection requirements):公用事业部门设定了更严格的穿越 (ride-through) 和负载重连接 (load reconnection) 要求,以减少数据中心负载引起的电网中断。这是因为数据中心的大功率波动可能导致电网不稳定,公用事业公司需要数据中心具备更强的抵抗电网扰动和快速恢复的能力。成本挑战 (Cost Challenges):弥补 AI/ML 负载波动的解决方案,例如安装电池储能系统 (BESS) 或超级电容器,可能会显著增加数据中心的基础设施成本。为了平滑负载波动和满足公用事业要求,数据中心需要投入额外的硬件和技术,这会增加运营成本。


负载变化图
上方图表: 负载百分比随时间变化的理想化模型 (Load Percentage vs. Time - Idealized Model)
这个图表展示了 AI/ML 负载波动的一个简化模型,其中包含了几个关键参数:
Crest Duration (a): 峰值持续时间,通常在 10-30 秒之间。表示负载达到高峰值并保持该状态的时间。Trough Duration (b): 谷值持续时间,通常在 -1-2 秒之间(此处负号可能表示相对于某个基准的下降,或者只是一个错误的符号,实际应为正值,表示持续时间)。表示负载处于低谷值并保持该状态的时间。Rise/Fall Time (c): 上升/下降时间,通常在 -0.5-2 秒之间。表示负载从低谷上升到高峰或从高峰下降到低谷所需的时间,这体现了负载变化的速率。
这个图表模拟了负载的快速上升、保持高峰、快速下降、保持低谷再上升的周期性变化,反映了 AI/ML 训练集群可能出现的功率波动模式。
下方图表: 运行大型 AI 训练集群时的功率波动 (Power fluctuations when running large AI training clusters)
这个图表是一个实际的功率波动测量数据,显示了运行大型 AI 训练集群时更复杂的实时功率变化。
Y 轴 (Load Percentage 或 Power): 表示功率负载的百分比或实际功率值。X 轴 (Time): 表示时间。图线: 绿色虚线和实线表示功率的波动范围和瞬时值。蓝色标注: 图中有一个蓝色框框住的区域,并标注了 15 MW,这可能表示在该时间段内功率波动的峰值或范围达到了 15 兆瓦,这突显了 AI 负载可能引起的巨大功率变化。
为应对负载这样的调整,需要进行**微电网控制+电池储能系统(BESS)。


微电网控制+电池储能系统(BESS)
上方图表:电力导入功率和 BESS 功率随时间的变化 (Utility Import Power vs. BESS Power over Time)
这个图表展示了电网导入功率(Utility Import Power,蓝色曲线)和 BESS 功率(绿色曲线)随时间变化的动态过程。
X 轴 (Time): 时间(从 10:13:10 到 10:14:00)。Y 轴 (Value): 功率值。蓝色曲线 (Utility Import Power): 显示了从公用电网导入的电力。在图表的左侧,电网导入功率波动较大。在某个时间点(约 10:13:25),电网导入功率突然下降并趋于稳定。绿色曲线 (BESS Power): 显示了电池储能系统的功率。在电网导入功率下降的同时,BESS 功率迅速上升并稳定在一个正值。这表明当电网导入的电力减少时,BESS 正在放电以弥补功率缺口,从而维持了总负载的稳定供电。
这个图表生动地展示了 BESS 如何通过快速响应电网或负载变化,来平滑电网导入功率,提供辅助支撑服务。
下方图表:控制面板界面 (Control Panel Interface)
这部分展示了一个复杂的控制面板界面,显示了电池储能系统(BATTERY 1)的实时运行数据和控制设置。
Control Module (控制模块):显示了系统的运行状态(Running)、启停控制(Start/Stop)、手动功率设定点(Manual kW SP)、基准功率设定点(Base kW SP)和电池荷电状态百分比(Base SOC %)。Regulate/Set/Regulate: 似乎是功率控制模式的选项。Operating Limits (运行限制):设定了电池的充放电功率上下限(P Lower Limit, P Upper Limit)、无功功率上下限(Q Lower Limit, Q Upper Limit)以及 SOC 的上下限。Max Charge Rate kW / Max Discharge Rate kW: 最大充放电速率。Critical Limits (临界限制):定义了更严格的临界运行阈值,例如当 SOC 达到低值或高值时,系统会触发相应的保护机制。Battery Status (电池状态):显示电池的当前状态,例如充电模式(Charging Mode)、测量到的有功功率(Measured kW)、无功功率(Measured kVAR)、电压(Measured KV)、频率(Measured Hz)和荷电状态百分比(State Of Charge %)。Battery Connection (电池连接): 显示电池是 Online(在线)还是 Remote(远程)。Remaining Energy / Battery Capacity kWh:显示剩余能量(2166.21)和电池容量(3874.90 kWh),可以计算出当前的荷电状态。右上角的 BATTERY 1 标签下方显示 **55.90 %**,这应该是电池当前的荷电状态 (SOC)。


对微电网控制的展望顶层:电网服务提供商/市场 (Grid Service Provider/Markets): 代表了外部电网和电力市场。通过 标准接口 (Standard Interface) 与 软件基础设施 (Software Infrastructure) 连接。中间层:数据中心网络 (Data Center Networks): 虚线框表示数据中心的内部网络。软件基础设施 (Software Infrastructure): 可能是微电网管理系统的高级应用层,负责数据分析、决策和与电网市场的交互。通过 标准接口 (Standard Interface) 与 微电网控制器 (Microgrid Controls) 连接。核心层:BESS 控制器 (BESS Controllers)发电机控制器 (Gen Controllers)光伏控制器 (PV Controllers)其他 DER 控制器 (Other DER Controllers)微电网控制器 (Microgrid Controls): 微电网的核心大脑,负责协调和控制所有连接的分布式能源。通过 标准接口 (Standard Interface) 与 继电器 (Relays) 连接,实现保护功能。通过 标准接口 (Standard Interface) 连接到各种 **分布式能源控制器 (DER Controllers)**:底层:BESS 模块 (BESS Module)发电机 (Generator)光伏 (PV)DER (其他分布式能源)每个分布式能源控制器下方是实际的 **分布式能源模块 (DER Module)**:这些模块通过 供应商专有协议 (Vendor Proprietary Protocols) 连接到各自的控制器,并通过各自的 **网络 (network)**(如 BESS network, Gen network)进行通信。这强调了尽管上层是标准接口,但底层设备通常使用供应商自己的通信协议。通过在微电网控制器及其上层和下层组件之间建立标准接口,可以实现不同系统和设备的有效集成和互操作性。
电压穿越需求


电网穿越需求Y 轴 (Voltage (Percentage) - 电压 (百分比)): 表示电网电压相对于额定电压的百分比。例如,100% 表示额定电压,90% 表示电压跌落了 10%。X 轴 (Cumulative Time (Seconds) - 累积时间 (秒)): 表示电压扰动持续的时间。
图表中的区域和边界线定义了设备在不同电压水平和持续时间下应采取的操作:
1. 强制运行区域 (Mandatory Operation):
绿色区域 (Continuous Operation - Infinite time):在大约 90% 到 105% 的电压范围内,系统被要求无限期地持续运行。这意味着设备必须能够在正常的电压波动下长时间稳定工作。蓝色区域 (Continuous Operation - 30 minutes):在高于 105% 到大约 110% 的电压范围内,系统被要求持续运行 30 分钟。这表明设备可以承受一定程度的过电压,但持续时间有限。蓝色网格区域 (Mandatory Operation - 低压):例如,在电压跌落到 80% 到 90% 之间时,可能需要持续运行较长时间(超过 6 秒)。在电压跌落到 50% 到 80% 之间时,强制运行的时间缩短到大约 3 秒。在电压跌落到 25% 到 50% 之间时,强制运行的时间更短,约为 1.2 秒。这反映了电网对分布式能源在电压暂降(sag)时需要保持连接和支持电网的要求。在低于 90% 的电压水平,图表中有一个阶梯状的红色边界线和蓝色网格区域。这个区域表示在特定电压跌落幅度和持续时间内,设备必须强制运行。
2. 允许运行区域 (Permissive Operation):
橙色区域 (Permissive Operation):在非常低的电压水平(例如,低于 10% 到 25%)和非常短的持续时间(例如,小于 0.32 秒)内,设备可以允许运行。这意味着在此极端情况下,设备可以选择保持连接,但不强制。
3. 可能穿越或跳闸区域 (may ride-through or may trip):
红色边界线以外的区域:这些区域代表了超出强制运行或允许运行阈值的电压和时间组合。在这些区域,设备可以继续运行(穿越),也可以脱网(跳闸)。通常,设备会在这些区域内脱离电网以保护自身。例如,长时间的过电压(超过 110%)或长时间的严重欠电压(低于强制运行阈值)都可能导致设备跳闸。
意义 (Significance):
电网稳定性: 电压穿越要求是电网运营商用来确保在发生故障时,连接到电网的分布式能源(如风电、光伏、储能系统以及数据中心等大型负载)能够保持连接,从而防止连锁反应导致更大范围的停电。AI 负载的考虑: 对于像数据中心这样拥有波动性 AI 负载的设施,其内部电源系统(如前面提到的微电网和 BESS)必须设计成能够满足这些电压穿越要求。这意味着即使电网电压出现暂降或暂升,数据中心也需要能够保持其关键负载的稳定运行,或者至少在规定的时间内保持连接,而不是立即脱网。设备设计: 电源转换器、逆变器和控制器必须能够检测电网电压的偏差,并相应地调整其输出,以满足这些穿越曲线的要求。这通常涉及到复杂的控制算法和强健的硬件设计。
谷歌数据中心供电路线演化:


谷歌数据中心供电路线演化
这张图片展示了 Google 在数据中心采用 LVDC 配电的战略演进。从最初的Sidercar模块化设计,逐步过渡到设施级更集成、高效且支持多能源输入的解决方案。核心是通过固态变压器 (SST) 实现高压 AC 到低压 DC 的直接转换,并集成电池储能系统,以提高效率、可靠性。
如下是微软对未来的演进展望:


微软电力架构展望
1. 传统电力架构 (Traditional Power Architecture)
这种架构代表了当前数据中心或大型设施中普遍采用的电力传输方式。
起点: 从电网 (Utility) 接收高压交流电 (230-345kV)。变电站 (Substation): AC/AC 变压器将高压交流电降至中压交流电 (约 35kV)。电气室 (Electrical Rooms):通过中压馈线 (MV feeders) 将中压交流电送入电气室。电气室中的 AC/AC 变压器或 AC/DC 固态变压器 (SSTs) 将电压进一步降低到 800-1500V。数据大厅 (Data Halls):通过母线槽 (Busways) 将 800-1500V 的电力送入数据大厅。数据大厅中的 AC/DC 或 DC/DC 电源架 (Power Shelves) 将其转换为低压直流电 (LVDC)。LVDC 通过母线 (Busbar) 分配给各个机架 (Racks)。
特点: 这种架构通常涉及多次 AC-AC 和 AC-DC 转换,每个环节都会有损耗,并且需要大量的铜缆和变压器。
2. HTS 电力架构:分散式电源转换 (HTS Power Architecture: Disaggregated Power Conversion)
这种架构引入了 HTS 馈线,并对电源转换进行了分散。
起点: 从电网 (Utility) 接收高压交流电 (230-345kV)。“变电站” ("Substation"): AC/AC 变压器或 AC/DC 固态变压器 (SSTs) 将高压交流电转换为 800-1500V 的电力。这里的“变电站”可能是一个更紧凑或集成的转换单元。HTS 馈线 (HTS Feeders): 关键变化在于使用 HTS 馈线直接将 800-1500V 的电力传输到数据大厅。优势: HTS 馈线具有零电阻、高电流密度和低损耗的特点,使得长距离传输或在空间受限的环境中传输大功率电力变得更加高效和紧凑。数据大厅 (Data Halls):数据大厅中的 AC/DC 或 DC/DC 电源架 (Power Shelves) 将 800-1500V 的电力转换为低压直流电 (LVDC)。LVDC 通过母线 (Busbar) 分配给各个机架 (Racks)。
特点: 相较于传统架构,HTS 馈线取代了中压馈线和部分母线槽,减少了传输损耗,并可能允许电源转换设备更接近负载。电源转换(从 800-1500V 到 LVDC)仍然在数据大厅内部进行。
3. HTS 电力架构:分散式电源架 (HTS Power Architecture: Disaggregated Power Shelves)
这是对 HTS 技术的更进一步应用,将 LVDC 转换提前,并在更远的距离传输低压直流电。
起点: 从电网 (Utility) 接收高压交流电 (230-345kV)。“变电站” ("Substation"):AC/AC 变压器或 AC/DC 固态变压器 (SSTs) 将高压交流电降压并进行 AC/DC 转换。紧接着,AC/DC 或 DC/DC 电源架 (Power Shelves) 立即将电力转换为低压直流电 (LVDC)。这意味着电源转换被“分散”到了“变电站”区域,更靠近电网侧。HTS 馈线 (HTS Feeders): 最关键的变化是,现在 HTS 馈线直接传输的是 **LVDC (低压直流电)**。优势: 由于 HTS 具有零电阻特性,即使传输低压直流电,也能保持极高的效率。这可以消除数据大厅内 LVDC 母线的需求,简化数据大厅的电力基础设施。数据大厅 (Data Halls): HTS 馈线直接将 LVDC 送到各个机架 (Racks)。
特点: 这种架构将大部分电源转换(从高压 AC 到 LVDC)集中在“变电站”区域,然后通过高效的 HTS 馈线以 LVDC 形式直接供电给机架。这最大程度地减少了数据大厅内的电源转换设备和损耗,可能带来更高的整体效率、更简单的布线和更低的散热需求。


微软对distribution展望
左侧:传统分配 (Traditional distribution)
特点:占地面积主要由变电站决定 (Footprint dominated by substation): 变电站通常需要大量空间,是数据中心电力基础设施中占地最大的部分之一。单一大型地块配置 (Single large parcel site configuration): 传统数据中心倾向于在一个大型地块上集中建设所有基础设施,包括变电站、电气室和数据厅。架构示意图:PSU (Power Supply Unit): 电源单元,通常指服务器电源。GPU (Graphics Processing Unit): 图形处理单元,代表计算负载。NET (Network): 网络设备。CDU (Cooling Distribution Unit): 冷却分配单元,用于管理冷却液。变电站 (Substation): 位于最上层,负责将高压 (HV) 电力转换为中压 (MV)。图中显示为 HV ? MV xformers (高压转中压变压器)。电气室 (Elec Room): 变电站下方是电气室,负责将中压 (MV) 电力转换为低压 (LV)。图中显示为 MV ? LV。设备区: 电气室旁边是数据中心的各种设备,包括:冷却系统 (Cooling): 位于最下层,为所有设备提供冷却。
总结: 传统分配模式的特点是集中式设计,变电站和电气室占据了大量物理空间,这限制了数据中心的选址灵活性和密度。
右侧:HTS 分配 (HTS distribution)
这种架构利用了高温超导 (HTS) 技术的优势,实现了更灵活、更紧凑的电力分配。
特点:分散式电力基础设施 (Disaggregated power infrastructure): 电力基础设施不再是单一、集中的,而是可以根据需要进行分散部署。非连接的多地块配置 (Disjointed multi-parcel site configuration): 这意味着数据中心的不同部分(如变电站和数据厅)可以位于不连续的、甚至相距较远的地块上,通过 HTS 电缆连接。这大大增加了选址的灵活性。减少馈线拥堵 (Reduction of feeder congestion): HTS 电缆的高电流密度特性意味着在相同的输电容量下,所需的电缆数量和尺寸可以大大减少,从而缓解了馈线拥堵问题。架构示意图:HTS 电缆连接变电站与数据中心设备。图中显示 HTS 电缆从变电站引出,直接连接到 GPU、NET 和 CDU 等设备。HTS 电缆的引入消除了传统电气室中 MV 到 LV 的转换环节,因为它能够高效地直接传输低压或中压电力到负载点。图中显示了两个独立的变电站,都执行 HV ? MV ? LV 的转换,这可能表示冗余或不同的供电路径。一个独立的变电站,负责将高压 (HV) 转换为中压 (MV),并进一步转换为低压 (LV)。这意味着整个变电和降压过程可以在一个地方完成。左侧变电站 (Substation HV ? MV ? LV):右侧变电站 (Substation HV ? MV ? LV):HTS 连接 (HTS):设备区: 包括 GPU、NET 和 CDU。冷却系统 (Cooling): 位于最下层,为设备提供冷却。


细节展现
因为GPULoad Swings,800V架构下的电压结构势必会引入CBU和BBU


GPULoad Swings


储能介质分类
1. 储能技术分类 (Energy Storage Technologies):
绿色圆点 (Electrolytic Caps): 代表电解电容。这类储能设备通常具有极快的充放电速度和高功率密度,但能量密度较低(即相同体积下存储的能量较少)。蓝色圆点 (Intermediate Storage): 代表中间储能。这可能指一些介于电容和电池之间的技术,例如超级电容或某些混合储能系统。浅蓝色圆点 (Lithium Ion Batteries): 代表锂离子电池。这类储能设备具有较高的能量密度,适合长时间供电,但充放电速度相对较慢。
2. 轴刻度 (Axis Scales):
X 轴 (Time (s) - 时间 (秒)): 从 0.01 秒到 1000 秒(约 16.7 分钟),覆盖了从毫秒级到分钟级的储能时间需求。对数刻度意味着每增加一格代表时间翻倍或增加一个数量级。Y 轴 (Volume (cm3) - 体积 (立方厘米)): 从 10 到 1,000,000 立方厘米,同样是对数刻度,表示了储能设备所需体积的巨大差异。
3. 数据点趋势 (Data Point Trends):
左下角区域 (短时间、小体积):在时间轴的左侧(0.01 到 0.1 秒),主要分布着电解电容和一些中间储能设备。它们的体积通常较小,适用于提供瞬时高功率输出。第一个深绿色椭圆圈出了这个区域,强调了这些技术在极短时间内的作用。中间区域 (中等时间、中等体积):随着时间增加(从 0.1 秒到 10 秒),锂离子电池和更多中间储能设备开始出现。电解电容的体积也随之增大,以提供更长的供电时间。第二个深绿色椭圆圈出了这个区域,显示了不同技术在中等时间尺度下的体积需求。右上角区域 (长时间、大体积):在时间轴的右侧(10 秒到 1000 秒),主要由锂离子电池主导。为了提供更长时间的能量,这些设备的体积显著增大。第三个深绿色椭圆圈出了这个区域,表明锂离子电池在提供长时间能量方面具有优势,但需要更大的体积。
4. 底部工作负载阶段 (Workload Phases at the Bottom):
这些绿色的条形区域指示了不同储能技术可能适用的典型工作负载或系统要求:
EDPP (0.010 - 0.030 秒左右): 可能是“增强型动态电源性能”或类似含义,表示需要极快响应的功率需求。电解电容通常适用于此。WL Idle Periods (0.030 - 0.300 秒左右): “工作负载空闲期”,可能指在短暂停顿或微小扰动期间的能量需求。电解电容和一些中间储能适用于此。WL Long Idle Periods (0.300 - 3.000 秒左右): “工作负载长时间空闲期”,需要更长时间的能量保持。中间储能和小型锂离子电池可能介入。Workload Ramp (3.000 - 30.000 秒左右): “工作负载爬坡”,指系统从低负载到高负载的快速转换,需要一定时间的持续供电。锂离子电池和较大的中间储能适用于此。UPS + Grid Requirements (30.000 - 1000.000 秒以上): “UPS(不间断电源)+ 电网要求”,表示在电网出现故障或需要持续备用电源以等待发电机启动,甚至更长时间的电网支撑服务。锂离子电池是这个区域的主要解决方案。
目前可放置CBU和BBU的位置如下箭头所示:


放置CBU和BBU的位置
GB300Power Shelf在添加了上述措施后,整体改善如下:


增加储能后的波形
如下是相关标准:


相关标准
如下是松下对CBU和BBU的未来展望:


演进历史
右侧:实际经验与历史 (Actual Experience & history)
这部分展示了松下能源公司在数据中心电源解决方案方面的技术演进,特别是与英伟达 GPU 迭代的协同发展。
IT 设备概览: 展示了数据中心机架中 IT 设备(服务器、存储、交换机)、PDU (电力分配单元)、PSU (电源供应单元) 和 BBU (电池备用单元) 的部署示意图。其中 BBU 部分特别标明了 Panasonic ENERGY。开放计算项目 (Open Compute Project - OCP): 强调了松下在 OCP 框架下的参与和贡献,特别是 Open Rack (OR) 标准。NVIDIA GPU 世代演进:从 Turing (T4), Ampere (H100/H200) 到 Blackwell (GB200, Blackwell Ultra),英伟达的 GPU 性能持续提升,对数据中心电源提出了更高要求。BBU 功率输出增长:2015 年左右: 对应 ORv2 (Open Rack v2) 标准的 BBU 模块。2023 年左右: 出现了集成 DCDC 转换模块的 BBU 系统,并增加了削峰功能 (Peak Shaving function added)。这表示 BBU 不仅提供备用电源,还能帮助平滑负载波动,提高电网效率。2025 年左右: 预计推出 HPR 5.5kW (High Power Rack)。2026 年左右: 预计推出 HPRv2 12kW,功率输出比早期产品 **提高了 3 倍 (Output power x3 times)**。这表明随着技术进步,单位体积内的电源输出能力显著增强。HVDC 1MW Power Rack: 图中还展示了一个 HVDC 1MW 功率机架,可能代表未来更高功率密度的解决方案。从电芯到解决方案的演进 (Cell -> Module -> System -> Solution):Cell (电芯): 松下自身的电芯技术是基础。Module (模块): 将多个电芯组合成 BBU 模块。System (系统): 将 BBU 模块集成到更完整的电源系统中,例如加入 DCDC 转换和削峰功能。Solution (解决方案): 最终提供给数据中心用户的整体电源解决方案,包括机架、PMM (Power Management Module) 和 Shelf (货架) 等。


演进时间表
1. 英伟达 GPU 的发展和功耗趋势 (NVIDIA GPU Evolution and Power Consumption Trends):
GPU 发展历程: 图片上方时间轴显示了英伟达 GPU 从 2018 年的 Turing 架构,到 Ampere、Hopper (H100, H200),再到 Blackwell (GB200, GB300),以及未来预期的 Rubin、Rubin Ultra 和 Feynman 等架构的演进。GPU 功耗增长:2018 年,GPU 功耗约为 300W。到 2020 年,功耗增至约 400W。从 2023 年 Hopper 时代开始,GPU 功耗超过 1200W,并呈现出显著的“上升峰值 (Rising Peak)”现象,即功耗会瞬间大幅增加。随着 Blackwell 架构的推出,功耗进一步提升,并表现出“剧烈波动 (Intense Fluctuation)”的特点,这意味着功耗在短时间内频繁大幅度变化。未来几年,预计单个 GPU 的功耗将持续增长。机架 BBU 功率需求 (As a rack BBU power):与 GPU 功耗的增长相对应,机架级的 BBU 功率需求也大幅攀升。从 2018 年的 10kW 左右,增长到 2023 年的 30kW。到 2025 年左右,预计将达到 100-400kW。未来更进一步,可能需要 1MW 级别的机架 BBU 功率。伴随的散热挑战: GPU 功耗的剧烈增长和波动,导致 BBU/CBU 本身也面临更高的散热挑战 (Higher heat for BBU/CBU as well)。
2. 三大主要挑战 (Three Main Challenges):
图片明确指出了在当前及未来 AI/GPU 时代,数据中心电源解决方案面临的三个核心挑战:
挑战 #1: 高功率密度 BBU 解决方案 (High Power Density BBU solution)目标: 在 2026 年达到超过 100kW 的 BBU 功率密度 (Reach to more than 100kW in 2026)。这意味着需要在有限的空间内提供更大的备用电力。挑战 #2: 吸收峰值波动解决方案 (Solution for absorb peak fluctuations)目标: 开发 75kW 级的电容备用单元 (CBU) (75kW class Capacitor (CBU))。由于 GPU 功耗的剧烈波动,特别是瞬间峰值,需要能够快速响应并吸收这些波动的设备,CBU 因其快速充放电特性而成为理想选择。挑战 #3: BBU 和 CBU 的热管理 (Thermal management for BBU & CBU)目标: 专门为 BBU 和 CBU 提供有效的冷却方案 (Cooling for BBU/CBU)。随着功率密度的增加和功耗波动的加剧,BBU 和 CBU 在工作时产生的热量也会急剧增加,因此高效的散热是确保其性能和寿命的关键。


挑战1
BBU 功率密度演进 (BBU Power Density Evolution):
图片展示了 BBU 模块在相同尺寸和平台 (Same Size & Platform) 下,功率密度的显著提升:
HPR v1 (33kW/shelf): 这是起始点,表示第一代高功率机架 (High Power Rack) BBU 模块,每个货架提供 33kW 功率。HPR v2 (72kW/shelf): 第二代产品,功率密度大幅提升到 72kW/shelf。未来目标 (102kW/shelf): 最终目标是达到 102kW/shelf。图片左侧的“Output Power 1.4x/shelf”箭头从 72kW/shelf 指向 102kW/shelf,表明在现有基础上可以实现 1.4 倍的功率提升。
这种功率密度的提升对于数据中心至关重要,因为它意味着在相同的物理空间内可以部署更多的计算能力,提高空间利用率。
放电特性与考虑因素 (Discharge Characteristics & Consideration):
右侧的图表展示了电池放电过程中三个关键参数的变化以及安全考量:
Voltage (电压 - 蓝色曲线): 随着放电进行,电池电压逐渐下降。Remaining capacity (剩余容量 - 绿色曲线): 随着放电进行,电池的剩余容量线性减少。Temp. (温度 - 浅绿色曲线): 在放电过程中,电池内部会产生热量,导致温度逐渐升高。OTP (Over Temperature Protection - 过温保护 - 蓝色横线): 这是一条关键的温度阈值。当电池温度达到或超过 OTP 时,系统会触发保护机制。Discharge Stop (放电停止点 - 红色圆点与虚线): 图中显示,当电池温度达到 OTP 阈值时(红色圆点),系统会停止放电。此时,即使电池还有一定的剩余容量,也会出于安全考虑停止工作。


挑战2
1. 服务器负载波动示意图 (Server Load Fluctuation Diagram):
左侧的图表生动地展示了服务器负载的动态变化:
Server Load (服务器负载 - 实线): 显示服务器的功耗在短时间内(从毫秒到秒级别)会剧烈波动。它可以在 30% 到 180% 之间大幅度变化,出现尖锐的“峰值 (Peak)”和低谷“离峰 (Off-peak)”。DC supply from PSU (PSU 提供的直流电源 - 虚线): 理想情况下,PSU 提供的直流电源应该稳定,以满足服务器负载。波动范围 (+/- 10%): 表示如果直流电源无法很好地跟踪负载变化,可能会导致 10% 左右的电源波动,这会影响服务器的稳定运行。CBU 的作用: “超级电容器的充放电平滑了服务器负载的波动。交流线路问题得到解决。”这明确指出,CBU 的主要功能是作为缓冲器,吸收服务器负载的瞬时峰值和低谷,从而稳定由 PSU 提供的直流电源,并间接减轻对交流电网的冲击。
2. CBU 功率提升 (CBU Power Enhancement):
图片中间部分展示了在相同尺寸和平台 (Same Size & Platform) 下,CBU 功率的显著提升:
10U Shelf power 48kW: 原始的 10U 货架功率为 48kW。75kW: 通过利用先进的超级电容器技术,功率可以提升到 75kW。1.6x: 这意味着输出功率提高了 1.6 倍。
与 BBU 类似,CBU 功率的提升意味着在相同的物理空间内可以处理更大规模的功率波动。


BBU & CBU Spec
表格详细对比了三种配置的各项指标:
BBU w/ Shelf (带货架的 BBU): 基于锂离子电池,用于提供长时间备用电源。CBU (Flat type) (扁平型 CBU): 基于超级电容器,专门设计用于吸收峰值功率波动,但物理尺寸较小 (1OU)。CBU (like a BBU) w/ Shelf (像 BBU 一样的带货架的 CBU): 基于超级电容器,但其物理尺寸和货架兼容性设计得与 BBU 模块相似,以便在同一平台上灵活替换或混用。特性BBU w/ Shelf (带货架的 BBU)CBU (Flat type) (扁平型 CBU)CBU (like a BBU) w/ Shelf (像 BBU 一样的带货架的 CBU)Cell (电芯)锂离子电池 (Lithium-ion battery)超级电容器 (Super Capacitor)超级电容器 (Super Capacitor)Shelf Size (mm) (货架尺寸)*53786788 (2OU)53786746 (1OU) - 注意,这个扁平型 CBU 只有 1OU 高度53786788 (2OU) - 与 BBU 模块的尺寸完全一致Shelf Weight(kg) (货架重量)<83.3kg (11kg x6)<30kg x2<68.9kg (8.5kg x6)BBU/CBU qty (数量)6 (5+1) - 6 个模块,其中 5 个工作,1 个备用或冗余2 (2OU) - 2 个模块,占 2OU 空间6 (5+1) - 6 个模块,其中 5 个工作,1 个备用或冗余Output Power (per 2OU shelf) (每 2OU 货架输出功率)~50sec : 72.0kW (约 50 秒内提供 72.0kW 功率)~2sec : 150kW / ~5sec : 76kW (约 2 秒内提供 150kW,或 5 秒内提供 76kW)~2sec : 156kW / ~5sec : 84kW (约 2 秒内提供 156kW,或 5 秒内提供 84kW)Replaceability (可替换性)★☆☆ (低)★★★ (高)★★★ (高)Redundancy (冗余性)★★☆ (中)★★☆ (中)★★☆ (中)Flexibility for output (输出灵活性)★★★ (高) - BBU 擅长提供持续的能量,有较高输出灵活度★☆☆ (低) - 扁平型 CBU 功率高但持续时间短★★★ (高) - 结合了 CBU 的高功率和 BBU 的通用性Compatibility for shelf (货架兼容性)★★★ (高)★☆☆ (低) - 扁平型 CBU 尺寸不同,兼容性差★★★ (高) - 专为与 BBU 平台兼容而设计统一平台的重要性: 提案强调了构建统一平台架构的重要性。通过让 CBU 与现有 BBU 货架兼容,可以简化数据中心的电源基础设施管理,降低部署复杂性。CBU 的高功率瞬时输出: 无论是扁平型 CBU 还是像 BBU 一样的 CBU,它们在短时间(2-5 秒)内的输出功率都远高于 BBU(例如 150-156kW vs 72kW),这完美地契合了吸收 GPU 瞬态峰值功率波动的需求。像 BBU 一样的 CBU (CBU (like a BBU) w/ Shelf) 的优势:尺寸兼容性: 它的物理尺寸(53786788, 2OU)与标准 BBU 模块完全一致,这意味着它可以直接插入现有 BBU 货架中,实现真正的“即插即用”和灵活配置。重量优势: 尽管尺寸与 BBU 相同,但其重量更轻(<68.9kg vs <83.3kg)。高瞬时功率: 在短时间(2 秒)内能提供 156kW 的超高功率,远超 BBU。高可替换性和货架兼容性: 在这些方面都获得了最高评分,充分体现了其设计目标。BBU 的优势: BBU 在提供较长时间(~50 秒)的持续功率方面表现出色,适合作为备用电源。扁平型 CBU 的局限性: 扁平型 CBU 虽然功率高,但其独特的尺寸(1OU)导致货架兼容性较低,在统一平台策略下不如“像 BBU 一样的 CBU”有优势。


BBU like CBU Solution
图片对比了两种在 HPRv2 平台下部署 CBU 的策略:
利用 BBU 空间进行微调 (Fine adjustments with utilizing BBU spaces):全 BBU 机架 (Full BBU rack): 18 个 BBU,没有 CBU。总电源输出 204 kW (17+1 个 PSU)。CBU 覆盖率 0%。17x BBU, 1x CBU: 替换 1 个 BBU 为 1 个 CBU。BBU 功率降至 192 kW。CBU 功率 26kW/2sec。CBU 覆盖率 18%。15x BBU, 3x CBU: 替换 3 个 BBU 为 3 个 CBU。BBU 功率降至 168 kW。CBU 功率 78kW/2sec。CBU 覆盖率 55%。12x BBU, 6x CBU: 替换 6 个 BBU 为 6 个 CBU。BBU 功率降至 132 kW。CBU 功率 156kW/2sec。CBU 覆盖率 **111%**。概述: 在总共 6U 高度的 3 个电源货架中,通过替换部分 BBU 模块为 CBU 模块,来增加 CBU 覆盖率。这意味着 CBU 模块的尺寸和接口必须与 BBU 模块兼容。配置详情:图形化表示: 下方小图显示了 6U 高度下,随着 CBU 模块数量的增加(绿色方块代表 CBU),BBU 模块(灰色方块)相应减少。优势: 最大限度地利用了现有的 BBU 货架空间,不需要额外增加机架高度,实现了紧凑部署。通过增加额外高度进行调整 (Adjustments with additional height):全 BBU 机架 (Full BBU rack): 18 个 BBU,没有 CBU。总电源输出 204 kW。CBU 覆盖率 0%。18x BBU, 1x CBU shelf: 在原有的 BBU 配置上额外增加 1 个 CBU 货架。CBU 功率 75kW/2sec。CBU 覆盖率 51%。18x BBU, 2x CBU shelves: 额外增加 2 个 CBU 货架。CBU 功率 150kW/2sec。CBU 覆盖率 **105%**。18x BBU, 3x CBU shelves: 额外增加 3 个 CBU 货架。CBU 功率 225kW/2sec。CBU 覆盖率 **155%**。概述: 在原有的 3 个电源货架 (6U) 之外,额外增加 1U 高度的 CBU 货架来部署 CBU 模块。这意味着 CBU 货架是独立于 BBU 货架存在的,可能包含多个 CBU 模块。配置详情:图形化表示: 下方小图显示了机架总高度从 6U 增加到 9U,其中绿色的 CBU 货架位于 BBU 货架之上。优势: 可以保留完整的 BBU 备用能力,同时大幅度增加 CBU 的功率输出,提供更高的功率波动吸收能力


挑战3
1. BBU 和 CBU 的功率剖面 (BBU and CBU power profiles):
图片上方展示了 BBU 和 CBU 不同的工作模式,这些模式对热管理提出了不同的要求:
BBU profile (BBU 剖面图):放电 (Discharge from BBU): 持续数小时 (Several hours)。BBU 主要用于在主电源故障时提供长时间的备用电力。充电 (Charge to BBU): 持续 50 秒到 240 秒 (50s-240s)。在放电后,BBU 会进行充电。待机 (Standby): 持续数天 (Several days)。在大部分时间里,BBU 处于待机状态,等待主电源故障。特点: BBU 的充放电循环频率相对较低,但持续时间较长。CBU power profile of continuous operation (CBU 持续运行的功率剖面图):放电 (Discharge from shelf): 从货架放电。充电 (Charge to shelf): 向货架充电。特点: CBU 的充放电是几秒钟的重复性循环 (A few second repetitive),并且是持续的 (continue...)。这意味着 CBU 需要在高频率下进行大功率的充放电,以吸收服务器负载的瞬态波动。
洞察: CBU 的高频率、大功率充放电模式会产生更多的瞬时热量,对热管理提出了比 BBU 更严峻的挑战。
2. CBU 热仿真示例 (CBU Thermal simulation example):
左下方是一个 CBU 的热仿真图,展示了功率百分比与温度之间的关系:
CBU 模块示意图: 显示了 CBU 模块的内部结构和热量分布。温度随功率增加而升高: 随着功率百分比 (Power [%]) 的增加,CBU 模块的温度 (Temperature [degC]) 显著升高。热点 (Hotspot) 和危险区域: 当功率达到一定水平时(图中大约 70%-80% 处),CBU 模块内部会出现高温区域,并用一个红色的爆炸符号 (red starburst) 标记,这可能代表达到或超过了危险温度阈值。深蓝色到红色渐变: 颜色变化代表温度从低到高。深蓝色区域是低温区域,而黄色和红色区域是高温区域。
洞察: 这个仿真图直观地展示了高功率输出下 CBU 的热分布,强调了局部热点和整体温度升高带来的风险。
3. 温度对寿命的影响 (Impact of Temperature on Life):
右下方的图表展示了温度升高对设备寿命的负面影响:
ΔCap (容量变化): 纵轴可能代表电池/电容器的容量衰减或性能下降。Cycle (循环次数): 横轴代表充放电循环次数。ΔT=10degC → 1.5x shorter life: 明确指出,如果操作温度升高 10 摄氏度 (ΔT=10degC),设备的寿命将缩短 1.5 倍 (1.5x shorter life)。
洞察: 这个结论量化了温度对设备寿命的影响,进一步强调了有效热管理的重要性。即使是看似不大的温度升高,也可能对设备的长期可靠性和运营成本造成重大影响。


冷却解决方案
1. 自集成冷却系统示意图:
BBU/CBU 模块: 描绘了一个带有耦合连接器 (Coupling Connector) 的 BBU/CBU 模块,这些连接器用于液冷循环。Shelf (货架): 货架内部集成了冷却管道 (Coolant pipe) 和 CDU。冷却液通过管道流经货架,与 BBU/CBU 模块进行热交换。系统架构 (System Architecture): 下方的方框图展示了液冷系统的完整循环:CDU (Coolant Distribution Unit): 冷却液分配单元,包含泵 (Pump) 和热交换器 (Heat exchanger)。冷却液循环: 冷却液从 CDU 流出,经过耦合连接器进入 BBU/CBU 模块内的冷板 (Cold plate)。热交换: 冷板直接接触电芯 (Cells) 和 DCDC 转换器,吸收它们产生的热量。返回 CDU: 加热的冷却液通过耦合连接器返回 CDU,在热交换器中散热,然后再次被泵送出去,完成循环。
2. 空间利用挑战和解决方案:
2OU vs 1OU: 图片右上角对比了 2OU 和 1OU 两种高度。挑战: 对于 1OU 高度的货架,通常没有空间来额外安装冷却系统 (*no space for 1OU shelf)。解决方案: 提案通过利用货架内部空间 (Utilizing space inside the shelf) 来集成冷却系统。图中显示了在一个 2OU 高度的货架内部,如何在不占用额外机架空间的情况下,巧妙地集成了冷却组件(专利申请中)。
3. 关键工程挑战:CDU 小型化 (Challenge: Miniaturizing CDU):
图片中部下方突出显示了一个挑战:CDU 的小型化。目标尺寸: 140x65x30mm。这表明为了将 CDU 集成到货架内部的有限空间中,需要对其进行高度紧凑的设计。
4. 液冷效果 (liquid cooling effect):
最右侧的图表直观地展示了液冷技术带来的显著降温效果:
Without Cooling (无冷却): 上方的热图显示,在没有冷却的情况下,CBU 模块的温度非常高,颜色以红色和橙色为主,最高温度在模块中心区域(Max. cell)。With Liquid Cooling (有液冷): 下方的热图显示,在采用液冷后,CBU 模块的温度显著降低,颜色以绿色和蓝色为主,最高温度也明显下降(Max. cell)。Cooling effect: Δ16.7°C: 明确指出,液冷带来了 16.7°C 的温差,这表明液冷能够将 CBU 的最高温度降低 16.7 摄氏度。
洞察: 这个结果非常重要,因为它量化了液冷对温度控制的有效性。结合前面提到的“温度升高 10 摄氏度会导致寿命缩短 1.5 倍”的结论,16.7 摄氏度的降温效果将大大延长 BBU/CBU 的使用寿命并提升其性能稳定性。


未来技术展望NVIDIA GPU (英伟达 GPU):展示了 GPU 架构从 Hopper 演进到 Blackwell、Blackwell Ultra、Rubin 和 Rubin Ultra。这代表着 GPU 性能的不断提升,也意味着更高的功耗和热量生成。System (系统):松下正在开发支持 **800V HVDC(高压直流)的 1MW 功率机架 (1MW Power Rack for 800V HVDC)**。这表明未来数据中心电源系统将向更高电压和更大功率密度发展。Tech. (技术):新平台 (New Platform): 涵盖了通用货架兼容性、模块化设计等。冷却 (Cooling): 从早期的“安全设计 (Safety design)”向“**高压冷却技术/安全设计 (Cooling Tech. / Safety Design for HV)**”演进。这表明随着功率密度的增加和电压的提高,冷却技术必须更加先进和安全。BBU (电池备用单元):2025 年: 达到 72kW/shelf 的功率密度。2027 年及以后: 目标是实现 102kW/shelf 的更高功率密度。CBU (电容备用单元):2026 年: 实现 48kW/shelf 的功率。2027 年及以后: 目标是达到 75kW/shelf 的更高功率。DCDC (DC-DC 转换器):2024 年: 功率密度超过 500 W/inch3。2026 年: 提升到 1,000 W/inch3。2027 年及以后: 进一步达到 2,000 W/inch3。这表明 DC-DC 转换器将变得更加紧凑高效,以适应高功率密度机架的需求。Li-ion Battery (锂离子电池):抗热、耐用 (Anti-Heat, Durability)更高容量 (Higher Capacity)更长寿命 (Longer Life)更高可靠性 (Higher reliability)RX5 cell (2024 年): 80W, 7.4Wh, NCM (镍钴锰) 类型。W cell (2025-2026 年): 120W, 9.0Wh, NCA (镍钴铝) 类型。特点包括:High Power cell (>200W) (2027 年及以后): 功率超过 200W 的高性能电芯,通过新型 tab-tech.(引线技术)降低阻抗 (Lower Impedance by new tab-tech.)。
送礼物
还没有人送礼物,鼓励一下作者吧
[收藏本文] 【下载本文】
   科技 最新文章
如何看待预测市场Polymarket撤回了一个“20
为什么西方国家愿意把开源技术白白让中国学
人大代表建议短视频凌晨 1 点至 5 点深夜静
为什么现在互联网的反智主义这么严重?
ai 已经能编出很完美的程序,程序员这个行业
OpenClaw 爆火背后,这种 AI 工作流,真能替
工业克苏鲁到底有多可怕?
如何评价《S.H.I.T》(中文名《构石》)期刊
现在的暗网真的像网上说的那样充满血腥,暴
如何评价《S.H.I.T》(中文名《构石》)期刊
上一篇文章      下一篇文章      查看所有文章
加:2026-03-11 13:46:24  更:2026-03-11 13:48:35 
 
娱乐生活: 电影票房 娱乐圈 娱乐 弱智 火研 中华城市 印度 仙家 六爻 佛门 风水 古钱币交流专用 钓鱼 双色球 航空母舰 网球 乒乓球 中国女排 足球 nba 中超 跑步 象棋 体操 戒色 上海男科 80后
足球: 曼城 利物浦队 托特纳姆热刺 皇家马德里 尤文图斯 罗马 拉齐奥 米兰 里昂 巴黎圣日尔曼 曼联
  网站联系: qq:121756557 email:121756557@qq.com  知识库