最好看的新闻,最实用的信息
07月02日 11.3°C-11.8°C
澳元 : 人民币=4.69
基隆
今日澳洲app下载
登录 注册

SemiAnalysis创始人:推理或超越石油成全球最大市场,2040年太空数据中心将主导全球算力(组图)

3小时前 来源: 华尔街见闻 原文链接 评论0条

近日,SemiAnalysis创始人Dylan Patel接受红杉资本播客《Training Data》采访,从推理市场规模、算力效率、硬件架构竞争到英伟达的战略布局,多方位地阐述了他对AI基础设施走向的判断。

Dylan Patel预测,AI推理将成为全球最大市场之一,占GDP多个百分点;到2030年,仅OpenAI和Anthropic合计算力需求将超100吉瓦。他判断,未来3-5年太空算力可忽略不计,但到2040年太空将承载全球超半数新增算力。而英伟达支持新云厂商,本质是黄仁勋在下一盘防止被垄断的大棋。

SemiAnalysis创始人:推理或超越石油成全球最大市场,2040年太空数据中心将主导全球算力(组图) - 1

SemiAnalysis创始人:推理或超越石油成全球最大市场,2040年太空数据中心将主导全球算力(组图) - 2

推理市场将超越石油:算力可能永远不够用

Patel认为:"AI推理——无论是开源模型还是闭源模型——将是全球最大的市场之一,比石油还大。AI推理将占到GDP的若干个百分点。"

他的逻辑链条是:模型每次迭代升级,能完成的有效任务数量和价值都在扩大,而这个扩张速度持续快于算力的增长速度。以Anthropic的Claude Opus为例,他指出,"Meetos 5(即Claude 4/Opus级别)能做的任务量,根本不是Opus的2倍,而是远不止",但与此同时,全球算力并没有在同一时间段翻倍。

结果就是:供给追不上需求扩张,算力永远是稀缺的。他直言:"算力短缺会一直持续,因为模型扩大可用任务的速度,永远快过算力的增长。"

SemiAnalysis创始人:推理或超越石油成全球最大市场,2040年太空数据中心将主导全球算力(组图) - 3

2040年,超过一半的增量算力将在太空

对于太空数据中心,Patel表示,"未来三到五年,太空数据中心不会有太大意义。但在二十年后,我认为绝大多数算力将进入太空。"

具体节点上,他预测2030年仅OpenAI and Anthropic两家合计将拥有超过100吉瓦的算力,再加上Meta、Google等,届时用于推理的算力体量将极为庞大。到2040年,甚至可能达到太瓦(terawatt)级别。"

如果你看 2040 年,超过一半的增量算力将进入太空。但如果你看 2030 年,我认为不到 1%。

核心制约是地面能源成本——地面土地建电能力有限,一旦太空部署的经济性超过地面,算力向太空迁移将成必然。

SemiAnalysis创始人:推理或超越石油成全球最大市场,2040年太空数据中心将主导全球算力(组图) - 4

硬件软件协同设计:真正的100倍增益从哪里来

这是Patel最核心的技术判断。他直接反驳了访谈主持人关于“过去三年算力提升主要来自硬件”的观点:“我完全不同意你这个说法。”

他的分析是:从Hopper到Blackwell,最优化部署下性能提升约30倍,这主要是硬件。但过去三年,整体智能效率提升远超30倍,大部分增益来自模型层。关键在于协同设计的乘数效应

当你把这里的2倍和那里的2倍叠加,如果只是各层独立优化,可能得到8倍。但如果你跨三层协同优化,实际上可以得到100倍。

DeepSeek是最典型的公开案例——其专家模型(MoE)的形状专门为英伟达Hopper架构优化,因此在Hopper上运行出色,但在TPU上却表现不佳。反过来,Anthropic的模型更"稠密",更适合TPU架构;OpenAI的模型更"稀疏",更偏向GPU路线。

Patel强调:"TPU客观上是一款出色的芯片,承担了DeepMind所有推理和Anthropic几乎所有预训练。但它就是跑不好DeepSeek。"

他进一步指出,所谓"CUDA护城河",本质上不是CUDA本身,而是开源生态的模型形状问题:DeepSeek、Kimi、阿里、腾讯等公司的开源模型都是为GPU协同优化的,要在TPU上跑,效果就差。Google需要建立自己的开源模型生态(即Gemma系列)才能对抗这一效应。

SemiAnalysis创始人:推理或超越石油成全球最大市场,2040年太空数据中心将主导全球算力(组图) - 5

黄仁勋:主动打造多极算力格局

对于英伟达CEO黄仁勋为何大力扶持新兴云计算商(Neo Clouds),Patel说道:

Jensen 非常厌恶一种世界格局:超大规模云厂商垄断一切。这就是为什么他会向一些看起来不那么有把握的 AI 实验室砸钱——他在全世界各地游说,说 "你应该投这家公司",因为他想创造一个多极化的世界。这也是他为什么喜欢中国 AI 实验室——他想要多极化。如果只有 OpenAI、Anthropic 和谷歌的模型主导市场,他就完了。

逻辑很简单:如果全球只有OpenAI、Anthropic和Google的模型,如果算力只由超大规模云商建设,英伟达就会陷入被动。而今天卖给Crusoe或CoreWeave的GPU,五年后将削弱Google TPU和Amazon Trainium的市场地位,对英伟达而言是更好的长期格局。

他需要把分配的 '枪口' 对准新兴云商,帮助他们支撑集群,不惜一切。

SemiAnalysis创始人:推理或超越石油成全球最大市场,2040年太空数据中心将主导全球算力(组图) - 6

InferenceX:每年成本降60倍的活体基准

Patel团队搭建了名为InferenceX的实时推理基准测试系统,目前已获得CoreWeave、Oracle、微软、亚马逊、谷歌、OpenAI等机构捐赠的超过5000万美元硬件,每天在最新模型上持续运行,涵盖超过15种不同芯片类型。

其核心发现是:等效质量下,推理成本每年下降约60倍。“这是令人难以置信的。”他同时指出,每瓦智能(intelligence per watt)的改善约为40倍,略低于成本降幅,部分效率来自非功耗环节。

InferenceX的核心输出是"帕累托最优曲线"——在响应延迟(interactivity)与批处理吞吐量(throughput)之间,找到每个场景下的最优配置点,并将配置开源,任何人都可以直接下载使用。

"这条曲线是硬件、基础设施、模型、应用层所有事情的上游。"他举例:Anthropic的Claude Code快速模式比普通模式贵得多,OpenAI也有优先队列,本质都是这条曲线的商业化体现。

SemiAnalysis创始人:推理或超越石油成全球最大市场,2040年太空数据中心将主导全球算力(组图) - 7

SemiAnalysis创始人:推理或超越石油成全球最大市场,2040年太空数据中心将主导全球算力(组图) - 8

从汽车旅馆到半导体智库:一个自学者的逆袭

谈及Dylan Patel的个人经历时,他分享的成长轨迹与传统分析师截然不同。他从小在父母经营的汽车旅馆长大,对面是自家加油站——他开玩笑说,自己训练的第一个神经网络,是根据顾客外貌预判他们要买哪种烟。

八岁时,Xbox 360的“红圈死亡”故障迫使他拆机维修,从此打开了硬件世界的大门。12岁起,他活跃于各类技术论坛。大学毕业后,他在量化风险公司工作,因不满成果被抢功而离开。

2020年,他更频繁地在网上发表深度分析,被人肉搜索后索性改用真名,在24岁生日那天创立了SemiAnalysis网站。此后他开着皮卡、睡在车顶帐篷里,在美国国家公园间流浪了六个月,边旅行边写博客;随后又去拉丁美洲旅居近一年,每年参加超过40场全球供应链会议。

如今,SemiAnalysis已成为半导体与AI基础设施领域最具影响力的研究机构之一,团队近90人,年营收据传已接近1亿美元。

今日评论 网友评论仅供其表达个人看法,并不表明网站立场。
最新评论(0)
暂无评论


Copyright Media Today Group Pty Ltd.隐私条款联系我们商务合作加入我们

电话: (02) 8999 8797

联系邮箱: [email protected] 商业合作: [email protected]网站地图

法律顾问:AHL法律 – 澳洲最大华人律师行新闻爆料:[email protected]

友情链接: 华人找房 到家 今日支付Umall今日优选