大厂疯抢GPU,ElonMusk要买100万个?

来源: 证券之星 阅读量:17314次 时间:2024-12-06 11:55:20   

如果您希望可以时常见面,欢迎标星收藏哦~

过去几年,因为人工智能的火热,GPU的销量猛增。

根据英伟达的数据显示,在2023年,公司与 AI 工作负载相关的英伟达数据中心部门的销售收入为 184 亿美元,比去年同期增长了 409%。2023 年,Nvidia 在数据中心GPU市场占有约 98% 的份额,因为其旗舰 H100 芯片几乎没有竞争对手。

进入2024年,英伟达的GPU销量依然猛增,英伟达CEO黄仁勋也直言,公司新推出的Blackwell在市场的关注度非常高,也有很多客户在买。根据 Jon Peddie Research 的数据,今年全球 GPU 市场预计将超过 985 亿美元。黄仁勋也认为,数据中心运营商将在未来四年内花费 1 万亿美元升级其基础设施,以满足 AI 开发人员的需求,因此这个机会足以支持多家 GPU 供应商。

最近几天的消息看来,Elon Musk和Mark Zuckerberg已经率先开始了新一轮GPU争夺赛。

Elon Musk要打造100万GPU集群

据金融时报最新报道,埃隆·马斯克的人工智能初创公司 xAI 承诺将其 Colossus 超级计算机扩大十倍,以容纳超过 100 万个图形处理单元,以超越谷歌、OpenAI 和 Anthropic 等竞争对手。

Colossus 于今年早些时候建成,仅用了三个月时间,被认为是世界上最大的超级计算机,运行着一个由 100,000 多个互连的 Nvidia GPU 组成的集群。马斯克位于孟菲斯的超级计算机非常引人注目,因为他的初创公司能够快速将 GPU 组装成一个 AI 处理工作集群。“从开始到结束,只用了 122 天,”马斯克说。超级计算机通常需要数年时间才能建成。

他的公司可能还花费了至少 30 亿美元来组装这台超级计算机,因为目前这台超级计算机由 10 万块 Nvidia H100 GPU 组成,每块 GPU 的价格通常约为 3 万美元。马斯克现在想用 H200 GPU 来升级这台超级计算机,H200 GPU 的内存更大,但每块 GPU 的价格接近 4 万美元。

Nvidia也透露,称xAI 的“Colossus”超级计算机的规模正在扩大一倍。马斯克还在推特上表示,这台超级计算机即将在一座占地 785,000 平方英尺的建筑物内整合 200,000 个 H100 和 H200 Nvidia GPU。

戴尔首席运营官杰夫·克拉克周四在接受采访时表示:“我们从一张白纸开始,在短短几个月内大规模部署了数万个 GPU。”“该集群仍在建设中,我们正在脱颖而出。”

如上所述,马斯克的初创公司 xAI 正在开发一个大型设施,以提高其在打造人工智能工具的竞赛中的计算能力。大孟菲斯商会周三也发表声明称,扩大田纳西州孟菲斯工厂规模的工作已经开始。商会表示, Nvidia、戴尔和超微电脑也将在孟菲斯建立业务以支持扩张,同时将成立一支“xAI 特别行动团队”,以“为公司提供全天候礼宾服务”。

相关报道指出,目前尚不清楚 xAI 计划在扩展期间使用当前一代 Hopper 还是下一代 Blackwell GPU。Blackwell 平台的扩展性预计比 Hopper 更好,因此使用即将推出的技术而不是现有技术更有意义。但无论如何,获得 800,000 – 900,000 个 AI GPU 都很难,因为 Nvidia 产品的需求量巨大。另一个挑战是让 1,000,000 个 GPU 以最高效率协同工作,而 Blackwell 再次更有意义。

据华尔街日报之前的报到,英伟达的一位销售主管告诉同事,马斯克对芯片的需求给公司的供应链带来了压力。Nvidia 的一位发言人表示,公司一直努力满足所有客户的需求。

当然,此次扩张的资金需求是巨大的。购买 GPU以及电力和冷却基础设施可能会将投资推高至数百亿美元。xAI 今年已筹集了 110 亿美元,最近又获得了 50 亿美元。目前,该公司的估值为 450 亿美元。

Meta也砸百亿建设数据中心

在Elon Musk抢购GPU的同时,Mark Zuckerberg也不甘示弱。

Meta Platforms Inc周三表示,公司计划在路易斯安那州东北部建设一个价值 100 亿美元的人工智能数据中心园区,这将是该公司迄今为止建设的最大数据中心。该园区占地 400 万平方英尺,将坐落于里奇兰教区,这是一个以农田为主的农村地区,靠近现有的公用设施基础设施,预计本月破土动工,并持续到 2030 年。

数据中心规划的基础设施将容纳处理海量数据所需的网络和服务器,以支持日益增长的数字技术使用,并将针对人工智能工作负载进行优化,这些工作负载尤其需要数据和计算。一旦上线,它将能够支持Meta 的所有服务,包括 Facebook、Messenger、Instagram、WhatsApp 和 Threads。

在此次数据中心投资消息公布之前,其他公司也在努力扩大其数据和计算能力,以满足人工智能和机器学习应用程序和工作负载日益增长的需求。

Meta 数据中心战略总监 Kevin Janda 表示:“Meta正在构建人类连接的未来以及实现这一目标的技术。这个数据中心将成为这一使命的重要组成部分。”

路易斯安那州州长杰夫·兰德里表示,新数据中心将为该地区带来新的技术机遇。路易斯安那州经济发展局是一家致力于改善该州商业环境的政府机构,据该机构估计,该园区将创造约 1,500 个就业岗位。

“ Meta 的投资将使该地区成为路易斯安那州快速发展的科技行业的支柱 ,振兴我们州美丽的乡村地区之一,并为路易斯安那州的工人创造未来高薪工作的机会,”兰德里说。

Meta 没有透露新设施将支持多少 GPU,也没有透露打算使用哪家公司的芯片。据 Entergy称 ,该中心将由三座天然气厂提供电力,总发电量为 2.2 千兆瓦。他们也强调,其中大部分成本将用于加速器以及支持它们的主机、存储和网络。如果你假设人工智能设施 90% 的成本用于 IT 设备,那么建设该设施的成本为 10 亿美元,而设备成本为 90 亿美元。假设 IT 设备成本的一半多一点用于加速器,那么现在就是 50 亿美元。以平均 25,000 美元的价格计算,这相当于 200,000 个人工智能加速器。如果你假设这里将挤满未来自主研发的 MTIA 加速器,而这些加速器的成本只有这里一半,那么这些加速器的成本将达到 400,000 美元。

Meta 首席执行官马克·扎克伯格此前曾表示,到 2024 年底,公司将在公司数据中心运行 350,000 块 Nvidia H100 芯片,尽管该公司也在开发自己的 AI 硬件。

谁拥有最多的GPU?

除了上述两家厂商以外,包括微软、谷歌、AWS和CoreWeave以及国内一众的云厂商都成为了英伟达GPU的追逐者。财富在日前的报道中指出,一个由三家特别财力雄厚的客户组成的精英群体,在截至10月底的前九个月内,分别购买了价值100亿至110亿美元的商品和服务。。

而统计当前的GPU拥有量,按博客lesswrong的预估,如果都换成以H100的等效算力。截止目前,世界五大科技公司的2024年拥有的算力,以及2025年的预测:

  • 微软有75万-90万块H100,明年预计达到250万-310万;

  • 谷歌有100万-150万块H100,明年预计达到350万-420万;

  • Meta有55万-65万块H100,明年预计达到190万-250万;

  • 亚马逊有25万-40万块H100,明年预计达到130万-160万;

  • xAI有10万块H100,明年预计达到55万-100万;

该博客同时指出,按照2024 年人工智能状况报告 主要供应商购买 Blackwell 芯片的情况进行了估计——大型云公司正在大量购买这些 GB200 系统:微软购买了 70 万到 140 万个,谷歌购买了 40 万个,AWS 购买了 36 万个。据传,OpenAI 至少拥有 40 万个 GB200。

由此可见,新一代的Blackwell 的欢迎程度很高。目前正在建设的数据中心可能会采用 Nvidia 的 Blackwell 芯片,该公司预计明年将大量出货。不过,市场已经开始期待该公司推出的 Rubin 芯片,这是 Blackwell 之后的下一代芯片。

英伟达首席执行官黄仁勋在10月初接受CNBC 的《Closing Bell Overtime》节目采访时表示,该公司下一代人工智能芯片 Blackwell 的需求“疯狂”。他说道:“每个人都想拥有最多,每个人都想成为第一。”

黄仁勋在接受 CNBC 采访时表示:“在技术发展如此迅速的时代,我们有机会三倍投入,真正推动创新周期,从而提高产能、提高产量、降低成本、降低能耗。我们正在朝着这个方向努力,一切都在按计划进行。”

首席财务官科莱特·克雷斯 八月份曾表示,公司预计第四财季 Blackwell 营收将达数十亿美元。

Jensen 表示,Nvidia 计划每年更新其 AI 平台,将性能提高两到三倍。

Melius Research 分析师 Ben Reitzes 在一份研究报告中写道:“越来越多的猜测认为,Nvidia 的下一代 GPU——名为 Rubin——可能会比大多数投资者预计的 2026 年提前 6 个月准备就绪。”

Reitzes 警告称,芯片的发布很少会提前,并维持该股 195 美元的目标价,他表示,这是假设 Rubin 在 2026 年下半年进行部署。

在GPU广受欢迎的当下,英伟达无疑是最大的赢家。但AMD也不甘人后,正在努力成为这个市场的另一个重要角色。除此以外,微软、Meta、谷歌、AWS等巨头,也都在打造自主的AI芯片,希望在这个市场凭借自研的加速器,去英伟达GPU之间找到另一个平衡点。

例如AWS 首席执行官马特·加曼 在日前的大会中所说:“如今,GPU 方面实际上只有一个选择,那就是 Nvidia。我们认为客户会喜欢有多种选择。”

半导体精品公众号推荐

专注半导体领域更多原创内容

关注全球半导体产业动向与趋势

今天是《半导体行业观察》为您分享的第3968期内容,欢迎关注。

『半导体第一垂直媒体』

实时 专业 原创 深度

公众号ID:icbank

喜欢我们的内容就点“在看”分享给小伙伴哦

声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。

猜你喜欢
女性乳房保健的按摩手法是什么?按摩六招式让你乳房坚挺不下垂
女性乳房保健的按摩手法是什么?按摩六招式让你乳房坚挺不下垂

乳房对于女人来说非常的重要,可以增强女人的美观,但是很多女性再生育哺乳之后却出现了乳房下垂的现象,那么该如何预防乳房下垂呢?中医介绍,推拿按摩可以帮你有效的预防乳房下垂,下面就为大家介绍一下乳房保健的按摩手法。预防乳房下垂的按摩六招式1.将.....

做什么运动具有补肾功效 夜晚在床上做3个运动能补肾
做什么运动具有补肾功效 夜晚在床上做3个运动能补肾

我们现在的生活压力是很大的,生活中很多的人还没有时间去做做运动,忙碌的生活让很多的人出现了肾虚的现象,人们应该注意了解一些养肾的方法,专家表示在晚上可以一边看电视一边在床上做运动,我们看看这些方法吧。1.腹式呼吸平躺在床上,嘴合上,用鼻慢慢.....

如何按摩才能做到科学的保健养生 常按四大保健穴位强身延年益寿
如何按摩才能做到科学的保健养生 常按四大保健穴位强身延年益寿

我们都想健康长寿,如何才能实现这个目标呢?当然需要加强日常的保健养生了,那么如何才能做到科学的保健养生呢?穴位按摩是一个不错的方法,下面中医就为大家带来了四大保健养生穴位,经常按摩强体养生,延年益寿。涌泉穴动作要领:将左脚放到右膝上,右拇指.....

得了癌症后,一口发物都不能碰?北大肿瘤专家对忌口有不同的看法
得了癌症后,一口发物都不能碰?北大肿瘤专家对忌口有不同的看法

都说“天上龙肉,地上鹅肉”,老刘最近为了吃上一口鹅肉愁死了。老刘,六十三岁,前不久查出了肺结节,医生说要先观察,如果有恶性的倾向就做手术。全家对待这件事都非常上心,对老刘做出了各种限制,尤其是饮食,列出了一长串“发物”的黑名单。老刘心心念念.....

睡姿不对,身体遭罪!分享3种“最佳睡姿”,没准就有适合你的
睡姿不对,身体遭罪!分享3种“最佳睡姿”,没准就有适合你的

“睡觉不能脚朝西头朝东!”阿强和同事出差,订了一个双人间,同事神神叨叨地让他换一个朝向睡觉。“你说的都是迷信,朝哪睡其实都没关系。”“之前我就是脚朝西头朝东睡不着,换了之后马上就好了,其实和地球磁场有关.....”“打住打住,越说越玄乎,我.....

夏季来袭,儿童感冒了该如何区别风寒、风热感冒?抓住1个关键点
夏季来袭,儿童感冒了该如何区别风寒、风热感冒?抓住1个关键点

“我家孩子受了“寒”,为何要吃感冒清“热”冲剂?”王女士看着医生开的药忧心忡忡,迟迟没敢喂给孩子吃。王女士的儿子小亮今年5岁,昨天夜里被子盖不严,一大早就咳嗽,还嚷着浑身疼痛。王女士检查后发现儿子发烧了,一边咳嗽还捂着嗓子喊疼,估计是昨晚受.....

午餐这样吃,你不胖谁胖?
午餐这样吃,你不胖谁胖?

在减肥界,究竟是不吃早餐还是不吃晚餐已经撕了很久了,但无论是早餐党还是晚餐党,大家都很坚定地表示,午餐还是要吃的。既然午餐辣么重要,那么吃错午餐就很麻烦了~所以今天呢,给大家总结了几种常见的错误午餐,可以检查一下自己有没有吃错。1:低热量/.....

JAHA:辅助生殖技术妊娠的院内并发症
JAHA:辅助生殖技术妊娠的院内并发症

辅助生殖技术已成为不孕症常见的治疗手段,不孕症这一问题已影响到全球约4800万对夫妇。随着孕前心血管危险因素(如慢性高血压、肥胖和糖尿病)的增加,孕产妇年龄的增加引起了人们对与辅助生殖技术相关的妊娠并发症的担忧。辅助生殖技术是一组治疗不孕症.....