您的位置 首页 科技

改造万亿IT基建!英伟达给联想“画大饼”

拉斯维加斯的会展中心在CES落幕后,灯光熄灭、人群散去。但对全球AI产业而言,一场更为漫长、也更为昂贵的竞赛才刚刚进入关键阶段。

拉斯维加斯的会展中心在CES落幕后,灯光熄灭、人群散去。但对全球AI产业而言,一场更为漫长、也更为昂贵的竞赛才刚刚进入关键阶段。

今年的CES,依然是英伟达首席执行官黄仁勋站在聚光灯的中央,身着标志性黑色皮衣的他,发布了全新的Vera Rubin AI GPU平台,并给出了一组足以震动资本市场的数据:相较前一代Blackwell架构,新平台在训练性能上提升3.5倍,而推理成本则被压缩至原来的十分之一。

但是这一次,黄仁勋带来的不只是“更快的芯片”。在出席联想集团举办的Tech World大会时,黄仁勋为联想集团董事长杨元庆描绘了一个更宏大的图景——在过去三十年里,全球IT产业已经累计投入约10万至15万亿美元,构建起一整套以通用计算和集中式数据中心为核心的基础设施体系。但这套体系,正在系统性地失效。“如今都需要被重新发明、重新现代化。这正是为什么我们会看到眼前这些万亿美元级别的产业机会。”

改造万亿IT基建!英伟达给联想“画大饼”

AMD首席执行官苏姿丰用一台重达7000磅、布满液冷管线的Helios机架,向外界传递了一个一致的方向:当前我们正处于算力新时代的起始阶段……在这个时代,AI将无处不在,并广泛地存在于数据中心、工厂、医院、个人电脑以及边缘设备之中。

黄仁勋称这次变革背后的本质是“我们正在经历一次平台级的技术迁移。”

展开全文

在过去的三十多年里,IT 产业几乎每隔十年就会经历一次类似的结构性跃迁——从 PC 到互联网,从互联网到云计算,再从云计算到移动计算。在这三次迁移中,始终围绕CPU和传统代码构建计算生态。

黄仁勋称,在这次“全新的平台”中,应用将围绕AI构建。这就要求计算核心从CPU转向GPU,计算逻辑从“执行指令”转向“自主推理”。然而,整个IT产业过去三十年建立的基础设施,都是为“存储和检索信息”设计的,而不是为“自主推理和决策”设计的。传统数据中心的CPU集群,面对 AI 推理所需的海量非结构化数据(图像、语音、文本)和复杂神经网络计算,性能不足且成本高昂。

尤其是当AI从模型竞赛走向生产系统,算力的价值不再体现在峰值性能,而体现在稳定性、成本结构与可持续性上。推理市场正迅速扩张,并有望在未来几年内超越训练市场,成为AI经济的主战场。

两位芯片巨头在同一座城市、同一时间、用不同措辞表达的,其实是同一个判断:AI基础设施的上半场已经接近尾声,对于企业来讲下半场的竞争,将远比“谁拥有最多GPU”复杂得多。

AI基建下半场从“训练”到“推理”

在过去三年里,全球科技资本的投入方向高度集中。大模型训练成为AI竞赛的核心指标,算力的价值被简化为“谁能堆出更大的GPU集群”。OpenAI、微软、谷歌、Meta等公司争相扩建超级数据中心,英伟达的高端GPU几乎成为一种稀缺资源,其市值也随之被推至历史高位。

这一阶段的特征是高度集中、资本密集,以及明确的技术目标:训练出能力更强的通用大模型。

改造万亿IT基建!英伟达给联想“画大饼”

但进入2025年后,风向开始发生变化。华尔街的耐心正在耗尽——投资者发现,尽管巨头们投入数千亿美元训练大模型,但真正能商业化落地、产生稳定现金流的应用寥寥无几。更重要的是,基础模型的迭代速度开始放缓。GPT-5 的发布虽然引发关注,但相较于 GPT-4,性能提升更多是“量变”而非“质变”。大模型的训练已经进入“边际效益递减”阶段。

企业不再仅仅满足于展示一个聪明的“聊天机器人”,他们需要AI去工作——去优化供应链调度、提升生产效率,去实时处理数百万份保险理赔,去毫秒级控制高速公路上的自动驾驶车队,去每时每刻响应全球数十亿智能体的请求。

市场迫切需要AI从“展示能力”的阶段,迈入“承担责任”的阶段。而在这一阶段,决定成本结构和可扩展性的,不再是训练,而是推理(Inference),即 AI 模型在获得训练后,根据实时数据进行决策和响应的过程。

德勤在其《2026技术趋势》报告中指出,随着AI从实验室走向企业生产环境,市场正遭遇一种全新的“推理经济学”挑战。尽管单次推理的单位成本在快速下降,但由于使用频率和复杂度急剧上升,总体算力需求反而呈指数级增长。

这一趋势在代理式AI(Agentic AI)和物理AI(Physical AI)身上体现得尤为明显。

代理AI与物理AI重塑算力基建

代理式AI的本质,是将AI从“响应者”转变为“执行者”。它不再是“一问一答”的聊天机器人,而是能够自主调用工具、多步执行任务的“数字员工”。一个看似简单的任务指令,背后可能触发数百次推理调用:调用工具、拆解步骤、反复校验、再执行。这种多步、长链路的推理过程,往往伴随着大量“隐形Token”的生成,其算力消耗远高于传统问答式模型。

Gartner预计,到2028年,约33%的企业软件将内置代理AI功能,而这一比例在2024年尚不足1%。至少有15% 的日常业务决策将由代理AI 自主完成。

物理AI对算力的要求则更为严苛。当AI被嵌入机器人、自动驾驶系统或工业控制设备时,推理必须是实时、低延迟且高度可靠的。这直接推动算力从集中式云数据中心,向边缘侧和本地部署迁移。

本届CES,黄仁勋喊出了“物理AI的Chatgpt时刻即将到来”。英伟达在CES上展示的Project GR00T和Cosmos模型,正是试图为机器人构建一套“理解并执行物理世界规则”的通用推理框架。这类应用的共同特点是:推理必须靠近数据源,而不是依赖远程云端。

改造万亿IT基建!英伟达给联想“画大饼”

工业领域的物理 AI 同样对实时性要求极高。假设一座工厂希望进行智能化改造,他的需求是实时响应生产线上的突发情况——比如检测到零件缺陷时,立即调整加工参数;遇到设备故障时,自主切换备用生产线。这同样要求推理算力必须靠近生产现场(即边缘计算),否则数据传输的延迟会导致生产停滞。物理 AI 的核心是“感知-推理- 行动”的闭环,而推理是其中最关键的环节。如果推理不能实时完成,整个闭环就会断裂,AI 也就失去了在物理世界应用的价值。

至此,一个清晰的趋势已经浮现:AI算力将从“集中式训练”向“分布式推理”倾斜,AI基础设施不仅仅是昂贵的云端数据中心,还包括从边缘到终端的整个布局。

而随着代理式AI和物理AI的普及,算力需求不再呈线性增长。这也就不难理解,为何AMD掌门人苏姿丰的断言——“未来几年内,全球计算能力可能需要提升100倍。”

尽管对于趋势的预期已经非常明确,但代理AI的生产化部署并不顺利。德勤调查显示,2025年虽然有38%的企业在进行代理试点,但仅有11%的企业在生产环境中使用这些系统。高昂的成本是最为重要的原因。

从技术角度看,推理成本正在迅速下降。过去两年,AI推理的单位Token成本已经暴跌280倍——这得益于芯片架构创新、软件优化和规模效应。但企业的AI支出非但没减少,反而因用量爆发式增长陷入失控。这一现象在经济学中被称为“杰文斯悖论” :技术的提效降低了资源的使用成本,这反而刺激了需求的激增,最终导致资源总消耗量的上升。

对于率先大规模部署AI的企业而言,这一悖论已经变得异常现实。部分公司在公有云上的AI账单已攀升至每月数千万美元。当AI工作负载从偶发试验变为全天候运行的核心业务流程时,按量计费的云模式开始在经济上变得不可持续。

更重要的是,数据合规、安全和商业机密的考量,使得许多企业无法将核心数据完全托付给公有云。这迫使它们重新评估计算架构,从“云优先”转向“混合计算”。

这一转变,并非简单的成本优化,而是对过去三十年IT架构逻辑的根本修正——也正是黄仁勋所指的“重新发明计算基础设施”。

芯片巨头的答案与一个被低估的角色

英伟达与AMD给出的解决方案,路径不同,但目标一致:在推理时代,将“每Token成本”和能耗压缩到足够低。

英伟达的Rubin平台通过Vera CPU来处理复杂逻辑,让GPU专注于高效的矩阵运算;AMD的Helios机架则以超大显存为核心卖点,其搭载的MI455X芯片拥有惊人432GB HBM4内存,试图用更少的卡承载更多并发推理任务。

但在这场竞争中,一个共同点逐渐显现:无论是哪一种方案,都高度依赖于物理层面的工程能力。

推理时代的芯片,功率密度正在突破传统数据中心的极限。单机架超过100kW的功耗,使得风冷方案难以为继。散热不再是配套问题,而是决定算力能否兑现的前提条件。如果散热搞不定,再先进的芯片也只能降频运行,变成昂贵的废铁。

这正是联想在产业链中角色被重新评估的原因。

作为少数能够同时与英伟达和AMD展开深度合作的企业,联想是这两大芯片巨头战略布局中不可或缺的关键伙伴,也将成为全球IT基建改造的重要参与者。

改造万亿IT基建!英伟达给联想“画大饼”

在联想Tech World的舞台上,联想集团CEO杨元庆先是与黄仁勋共同发布了基于Rubin平台的“联想人工智能云超级工厂”;转过身,又与苏姿丰发布了新一代推理服务器,苏姿丰还宣布联想将是Helios平台的首发合作伙伴之一。

原因并不复杂。在推理成为核心负载后,AI基础设施的难点从“买到芯片”,转向“部署、散热、运维和规模化交付”。

“很多人并不知道,联想构建了全球最多的超级计算机。全球Top 500超级计算机中,有三分之一由联想打造。”黄仁勋称,联想所具备的不仅是制造能力,更是构建、部署并在超算级数据中心中交付复杂系统的综合能力。这是促成双方合作的重要原因所在。

传统企业数据中心是为信息存储与检索设计的,而AI时代的企业,需要的不只是几台服务器,更是能帮他们设计、建设、运营复杂“AI工厂”的全流程能力。这为联想这类混合式AI基础设施提供商打开了巨大市场空间,也是联想与英伟达携手推出“联想人工智能云超级工厂”的核心原因。

此外,联想在液冷技术上的长期投入,使其在这一阶段具备了罕见的先发优势。

其第六代Neptune海神液冷方案,允许在45°C条件下运行数据中心,无需传统冷水机组。这不仅降低了部署复杂度,也为企业节省了可观的电力成本。在推理成本高度敏感的环境中,能耗的每一次下降,都会直接反映为财务回报。

黄仁勋的雄心联想的方案

对于联想来讲,黄仁勋画的这个“大饼”的确是个“好干粮”——这场IT基础设施重构浪潮带来的绝非短期订单增长,而是深度落地其主张的混合式AI战略的关键一步,尤其对其基础设施方案集团(ISG)业务具有决定性的战略价值,这一业务能否快速扭亏一直是资本市场关注的焦点。

面对即将爆发的AI推理时代的到来,ISG渴求抓住机遇的愿望是迫切的。

非常重要的一个表现就是,联想ISG在此次Tech World上一口气发布了三款应对推理算力需求的产品:除了与AMD合作的AI推理服务器SR675i,还有AI推理服务器SR650i和边缘计算服务器SE455i。

改造万亿IT基建!英伟达给联想“画大饼”

正如我们前文所分析的,企业需要的不再是孤立的硬件设备,而是“芯片+工程部署+散热技术+运维服务”的一体化解决方案,所以其方案服务业务(SSG)也将因此受益。

借助与英伟达、AMD 的深度绑定,联想得以优先将全球最先进的芯片技术融入自身的硬件产品与解决方案,形成“芯片巨头技术输出+联想工程化落地”的互补模式,既提升了ISG产品的技术壁垒与溢价能力,更使其从传统硬件供应商升级为AI基础设施全生命周期服务商,彻底打开高端企业级市场的增长空间。

联想与英伟达、AMD 的战略伙伴关系,本质上是生态共赢的必然选择。对芯片巨头而言,联想的价值不仅是“首发合作伙伴”的渠道优势,更是其技术落地的“关键转换器”—— 英伟达的Rubin平台、AMD的Helios机架,借助联想的超算级部署能力与规模化交付网络,可以更快的转化为企业可直接使用的生产力工具;而对联想而言,绑定全球顶尖芯片厂商,意味着 ISG 业务能持续获得核心技术赋能,始终站在AI基础设施技术迭代的最前沿,同时借助芯片巨头的品牌势能,快速建立在AI推理领域的行业话语权。

这种 “技术互补、生态共生” 的伙伴关系,让联想在激烈的市场竞争中占据了不可替代的生态位,也让ISG业务得以借助这场万亿美元级别的产业机遇,提升整体盈利能力。

一场“重新发明”IT基建的竞赛

CES 2026所揭示的,不是一轮短期的产品周期,而是一场横跨十年的IT基础设施重构。

过去三十年,全球 IT 产业累计投入的10–15万亿美元基础设施,正在被逐一替换为适应AI推理需求的新型硬件、软件和服务。这一过程,就像工业革命时期用电力取代蒸汽动力,信息革命时期用互联网取代电报电话,将彻底改变人类社会的生产方式和生活方式。

对于企业而言,这场重构是一次“生死抉择”。那些能够快速搭建高效、安全、低成本的推理基础设施的企业,将在智能化浪潮中抢占先机,实现生产力的跨越式提升;而那些固守传统IT架构、错失推理时代机遇的企业,将逐渐被市场淘汰。正如杨元庆所言:“新一轮 AI 推理浪潮已经到来,谁能将智能部署到本地、边缘和用户端,让智能触手可及,谁就能在未来的竞争中活得更好。”

对于科技巨头而言,这场重构是一场“话语权之争”。英伟达试图通过“芯片+生态” 的闭环,垄断推理算力的核心技术;AMD试图通过“开放+差异化”,在企业级市场撕开缺口;联想则凭借“物理基础设施+全流程服务”,成为连接芯片厂商和客户的关键枢纽。

在这一过程中,真正的赢家,未必是发布会上最耀眼的那家公司,而是那些能够将算力转化为可复制、可运营、可盈利基础设施的参与者。这场万亿美元的基建重构浪潮,注定将充满竞争与合作、创新与颠覆。

正如黄仁勋描绘的,过去三十年的计算体系正在走向终点。而下一套体系的建设,才刚刚开始。

CES2026已落下帷幕(1月6日-1月9日)

雷科技史上最大规模CES报道团,已陆续启程回国。雷科技CES2026报道专题已推送超过55+内容(最终会超过65+)以及10+短视频,涵盖几乎所有参展CES2026的头部品牌(以中美韩日为主),涉及AI硬件、AI芯片、AI眼镜、具身智能、电视显示、智能清洁、智能影像、AI家电、AI健康、AI音频、AI汽车、AI出行、智能家居、AI PC、AI手机等核心领域的探展、对话、新品、观察等内容。

相关内容除了自有渠道外,还被腾讯、网易、头条、百度、36kr等平台重点推荐。您可以在主流平台搜索“雷科技 CES”回顾CES2026的核心内容。

CES2026已落下帷幕(1月6日-1月9日)

雷科技史上最大规模CES报道团,已陆续启程回国。雷科技CES2026报道专题已推送超过55+内容(最终会超过65+)以及10+短视频,涵盖几乎所有参展CES2026的头部品牌(以中美韩日为主),涉及AI硬件、AI芯片、AI眼镜、具身智能、电视显示、智能清洁、智能影像、AI家电、AI健康、AI音频、AI汽车、AI出行、智能家居、AI PC、AI手机等核心领域的探展、对话、新品、观察等内容。

相关内容除了自有渠道外,还被腾讯、网易、头条、百度、36kr等平台重点推荐。您可以在主流平台搜索“雷科技 CES”回顾CES2026的核心内容。

本文来自网络,不代表大火龙新闻网立场,转载请注明出处:http://www.suned.cn/86705.html

作者: wczz1314

为您推荐

联系我们

联系我们

13000001211

在线咨询: QQ交谈

邮箱: email@wangzhan.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部