老黄不负众望,实现了四连胜。
2月22日,英伟达公布了2024财年第四季度财报。数据显示,该公司Q4季度实现营收 221 亿美元,同比增长265%,净利润122.85亿美元,同比增长769%,关键指标均大幅超出市场预期。同时,2024财年全年营收为609.22亿美元,同比增长126%;净利润为297.60亿美元,同比增长581%。
在这之前,英伟达三季度业绩十分亮眼,营收均超出分析师预期10% 至 20%。与业绩一同起飞的还有股价。自从AI浪潮兴起,英伟达股价节节攀升,市值已经站上了历史最高位。
昨晚,英伟达市值单日市值飙升2770亿美金,先后超过亚马逊、谷歌,达到接近2万亿美金,成为美股第三、全球第四大公司。一夜涨出2770亿美金有多夸张?就??是一夜涨出一个阿里巴巴+百度+京东。
因此在Q4财报发布之前,很多人认为英伟达应该是走到了顶峰。有分析师警告:将于当地时间周三公布的英伟达业绩报告可能会给美股涨势“踩刹车”。最终,英伟达用扎实的成绩单再一次狠狠“打脸”市场。
但市场的担忧也有一定道理。作为科技板块乃至整个美国股市的主线,英伟达贡献了纳斯达克100指数今年三分之一的涨幅,高盛集团的分析师将其称为“地球上最重要的股*”。而英伟达看似一路高歌,但也危机四伏。中国市场的变动、Meta、特斯拉、Alphabet和亚马逊等大型科技公司正加入芯片大战,这可能会对英伟达未来的需求带来压力。压力与希望并存,英伟达将会如何应对?
手持“数据中心”金铲子
英伟达赚翻了
01
三个月赚了221亿美元(约合1,589.4亿人民币),谁是英伟达的现金奶牛?
数据显示,销售额其中的大部分都来自英伟达的数据中心业务:其中大部分是炙手可热的 H100 系列,数据中心业务销售额增长409%,达到 184 亿美元。英伟达表示,数据中心业绩的增长反映了用于训练和推理大语言模型和生成式 AI 应用的英伟达 Hopper GPU 出货量的增加。
财报电话会上,英伟达 CFO Colette Kress 详细阐述了数据中心 184 亿美元季度营收背后的组成部分。让人惊讶的是,大模型的推理场景已经占据英伟达数据中心 40% 的营收比例,这意味着,主流大模型回答的每一个问题、输出每一行代码背后都少不了英伟达芯片,而它们的确带来了实实在在的业务和业绩。
她还举例消费互联网公司部署人工智能对它们自己和对英伟达业绩的帮助,“Meta 在最新的一个季度中提到,更准确的预测和改善的广告商绩效是其收入显著加速的原因之一。” 发布财报当天,英伟达宣布和 Google 一起优化其大模型 Gemini,以加速在云端、数据中心和个人电脑上使用英伟达 GPU 进行推理。
AI带来的算力淘金热,有可能继续持续。英伟达首席执行官黄仁勋(Jensen Huang)曾在新闻稿中说道:“加速计算和生成人工智能已经达到了临界点。全球各地公司、行业和国家的需求正在激增。我们的数据中心平台由日益多样化的驱动因素提供支持——大型云服务提供商和GPU专业提供商以及企业软件和服务提供商对数据处理、培训和推理的需求。
此外,黄仁勋着重介绍了英伟达对于数据中心业务的展望和计划。他指出,当前数据中心业务正处于两个重要的行业变革之中,一是从通用计算向加速计算的转变,二是向生成式人工智能的转变。
有起有落,英伟达在游戏、专业可视化和汽车细分市场的表现可能没有那么亮眼。英伟达的消费级业务并没有表现出同样的快速增长;其汽车业务销售额下降 4% 至 2.81 亿美元,而其 OEM 和其他业务(包括加密芯片等产品)增长 7% 至 9000 万美元。
同时,英伟达财报还暴露出一个问题:中国市场业务正在悄悄流失。以往,中国市场的数据中心业务曾一度贡献约20%-25%的总收益。但在Q4财季报告,中国市场的收入占比已经大幅度下滑。对此,分析师预计,英伟达在中国的高端人工智能芯片市场份额可能会从当前的 80%,在未来五年内下降至 50%-60%,让位给华为等厂商。
即便如此,英伟达的业务正在全速运转,AI引发的算力需求依旧能为其带来源源不断的业绩。
AI持续火热,
英伟达的根基越来越稳?
02
踩中AI风口的英伟达如何继续狂飙?
春节期间,OpenAI发布了强大文生视频大模型Sora再次震惊国内外科技圈。众人感慨人工智能颠覆了人们对世界认知的同时,也清楚地意识到:Sora引爆的文生视频大模型将会大幅推动人工智能基础设施的需求。
OpenAI自从ChatGPT以来,算力一直是圈内热议话题,这意外让英伟达成为AI狂潮的最大赢家。同时,在缩放法则(scaling laws)指导下,OpenAI创始人兼CEO山姆·阿尔特曼提出了芯片需求每三四个月就要翻一番的大模型时代“摩尔定律”。
Raymond James分析师指出,英伟达 H100每块售价在2.5万—3万美元之间,尽管黄仁勋说过“买的越多、省得越多,但再怎么大批量采购,可能仍要花费超90亿美元。而这些资金大多数都会流入为大模型提供算力支持的‘卖铲人’英伟达手中。”
黄仁勋认为,包括 Sora 在内的强人工智能应用场景背后,行业硬件的升级换代仍处于早期阶段。他预测整个行业将会需要大约 2 万亿美元的英伟达芯片,才能满足未来的算力需求。
英伟达的供货能力如何?Colette Kress表示,总体上英伟达 GPU 仍然处于严重供不应求的状态,即使台积电的产能逐渐增长,2024 年这种情况会稍有改善,但随着下一代 GPU 芯片的发布,短时间内 GPU 一卡难求的情况,也难以得到明显缓解。
但英伟达也积极做好应对措施,提升供货速度。此前,商业内幕报道称,英伟达已经开发了一个名为ChipNeMo的人工智能系统,用于加快其GPU的生产速度。要知道,设计一款芯片耗时、耗人力,通常构建一枚芯片需要近1000人,每个人都需要了解设计过程的不同部分如何协同工作。
而英伟达设计的ChipNeMo系统运行在一个大型语言模型上,该模型建立在Meta的Llama 2之上,该公司表示,他们使用自己的数据对其进行了训练。作为回应,ChipNeMo的聊天机器人功能能够回答与芯片设计相关的查询,例如有关GPU架构和芯片设计代码生成的问题。
不过,关于ChipNeMo是否导致芯片生产加速的问题,英伟达尚未对外回应。
另据瑞银分析师近日分享给投资者的备忘录,英伟达大幅缩短了AI GPU的交付周期,从去年年底的8-11个月缩短到了现在的3-4个月。该机构认为英伟达此举背后有两种可能:该公司正在规划新的方案提高产能,满足未来的订单;英伟达目前已具备足够的产能,可以处理积压的订单,同时也不排除两个因素叠加的效果。
除了在提高效率方面下功夫,英伟达“上新”速度也十分喜人。以往,英伟达每隔两年才推出新款芯片,如今已经加速到每年一次。
今年1月初,英伟达在2024年国际消费电子展(CES)开幕前,发布了三款针对AI PC的新显卡,包括RTX 4080 SUPER、RTX 4070 Ti SUPER和4070 SUPER GPU芯片产品。
其中,GeForce RTX 4080 SUPER拥有更多的处理核心和更快的内存。该公司表示其运行Stable Diffusion XL图像生成软件的速度比上一代英伟达技术同类机型快1.7倍。新的芯片还将支持光线追踪,通过计算单条光线的路径来构建图像,分辨率为4K。
不止如此,英伟达甚至有内部孵化一个“Arm”的野心。不少知情人士透露,英伟达正在建立一个新的业务部门,专注于为云计算等公司设计定制芯片,有望进一步巩固英伟达在AI芯片方面的领导地位。这一切并不是空穴来风。有媒体报道,英伟达高管已经与亚马逊、Meta、微软、谷歌、OpenAI等公司的代表会面,讨论为他们定制芯片的事宜。
现如今,英伟达靠着时代风口和自身实力成为资本宠儿,荣登芯片市场王座。可是,英伟达想成为常胜将军,就要时刻保持市场敏感度。黄仁勋提到,通用计算增长逐渐失去动力,因此英伟达将重点放在加速计算上,通过提高计算效率和降低成本来满足不断增长的市场需求。
谁能啃下AI芯片这块大蛋糕?
03
AI芯片市场“一超多强”的格局已初见雏形,“一超”便是英伟达。
英伟达以80%的市占率几乎垄断了AI芯片市场,看似稳居行业龙头宝座,但不少人对这块市场虎视眈眈。
“多强”则是那些伺机而动的“友商”,其中便有英伟达的老朋友——AMD。此前,AMD推出用于大模型训练的MI300X芯片。AMD 表示,MI300X 基于一种能显著提升性能的新架构。这款芯片的最大特点是拥有 192GB 的高性能 HBM3 内存,传输数据速度更快,可以适配规模更大的人工智能模型。
这款加速卡采用 Chiplet 设计,拥有 13 个小芯片,基于 3D 堆叠,包括 24 个 Zen4 CPU 内核,同时融合了 CDNA 3 和 8 个 HBM3 显存堆栈,集成了 5nm 和 6nm IP,总共包含 128GB HBM3 显存和 1460 亿晶体管。
去年 12 月,Meta、OpenAI 和微软在 AMD 投资者活动上表示,他们都将使用 AMD 最新开发的人工智能芯片 Instinct MI300X。这表明,虽然英伟达的 GPU 芯片对于开发和部署 ChatGPT 等人工智能程序至关重要,但很多科技公司都在寻找替代品;今年2月,国外科技媒体 Windows Report 报道,AMD 公司为 Instinct MI300 系列加速器谋发展,将以较低的价格供货给微软公司,促进双方新一轮长期合作。
AI越热,芯片大战将会愈发激烈。英伟达身后的“对手”并不只是商场中短兵相接的AMD,还有一匹黑马。
最近,一家名为Groq的初创公司赚取大量眼球。该公司的芯片推理速度较英伟达GPU提高10倍、成本只有其1/10;运行的大模型生成速度接近每秒500 tokens,碾压ChatGPT-3.5大约40 tokens/秒的速度。
据悉,Groq芯片完全抛开了英伟达GPU颇为倚仗的HBM与CoWoS封装,其采用14nm制程,搭载230MB SRAM,内存带宽达到80TB/s。算力方面,其整型(8位)运算速度为750TOPs,浮点(16位)运算速度为188TFLOPs。
此外,英伟达有可能还要警惕曾经谈判桌的“合作伙伴”。
面对芯片供不应求、价格昂贵的局面,微软、Meta、谷歌、OpenAI等大大小小的企业一边在寻求替代英伟达的AI芯片产品,一边筹划组建自己的芯片团队。
今年2月,有媒体报道,Meta第二代自研AI芯片Artemis今年正式投产。Meta CEO扎克伯格此前宣布,计划到今年年底部署35万颗英伟达H100 GPU,使得Meta共拥有约60万颗GPU用于运行和训练AI系统。
不过,新的芯片将被应用于数据中心的推理任务,与英伟达等供应商的GPU一起协同工作。
同时,阿尔特曼也在组建自己的芯片帝国。此前,阿尔特曼个人曾向旧金山芯片初创公司Rain AI投资了超100万美元,该公司生产模仿大脑工作方式的芯片,目标是为AI公司制造“低成本和节能的硬件”。
上个月,彭博社报道,阿尔特曼的目标是筹集数十亿美元,大幅提高全球制造尖端计算芯片的能力,避免资金短缺,他担心这将干扰人工智能的大规模部署和该领域的持续发展。
但不愿再被算力卡脖子的阿尔特曼有一个极为大胆想法——正在计划筹集7万亿美元重塑全球半导体行业。
斥资7万亿美元有多夸张?有网友估算,如果阿尔特曼拿到7万亿美元,可以买下英伟达、AMD、台积电、博通、ASML、三星、英特尔、高通、Arm等18家芯片半导体巨头。剩下的钱还能再“打包”Meta,再带回家3000亿美元。
黄仁勋有些讽刺地回应道,阿尔特曼相信芯片行业将会推动AI成本下降:“(七万亿美元)显然能买下所有的GPU,如果你认为计算机无法发展得更快,可能会得出这样的结论:我们需要14颗行星、3个星系和4个太阳来为这一切提供燃料。但是,计算机架构其实在不断地进步。”
不论阿尔特曼的“芯片帝国大厦”能否正式落地,OpenAI踏足芯片阵地的意图已经十分明显了。
同样想与黄仁勋掰手腕的大佬,还有一度跌落神坛的投资人、亿万富翁、日本软银集团创始人兼首席执行官孙正义。彭博社称孙正义欲为AI芯片企业筹资1000亿美元,与英伟达竞争。
报道称,孙正义正在寻求最多1000亿美元资金,为一家芯片企业提供资金,与英伟达的AI芯片竞争。该项目由孙正义直接领导,以日本创造和生命之神“伊扎那吉”(Izanagi)命名,部分原因是它包含了通用人工智能(AGI)的首字母。
有趣的是,孙正义和 OpenAI 的 Sam Altman 就半导体制造领域的联手和融资事宜进行了会谈,但目前Izanagi与 Altman 的野心是分开的,二者暂且不能达成合作。
诸侯割据,英伟达能否守住故有疆土?在回答这个问题之前,我们需要搞清楚英伟达的护城河有多深?
研究公司Fabricated Knowledge创办人欧劳林(Doug O‘Laughlin)指出,英伟达之所以可以主宰AI芯片制造业,是因为它提供了最好的芯片、最佳的网路设备和最优秀的软件。
正因为英伟达布局足够早、生态构建时间足够长,其他芯片想要吃下这块大蛋糕要面临着软件迁移存在隐性成本,而这并不是一件易事。
英伟达的城池也非固若金汤。受美国对华芯片出口限制政策影响,英伟达的中国市场面临着流失的问题。2023年10月,英伟达着手推出三款基于其AI芯片H100的“阉割”芯片:H20、L20和L2,并计划在今年二季度量产。
但中国互联网大厂测试英伟达“中国特供版”AI芯片样品,结果并不理想,更有一些中国客户转而购买华为等本土企业开发的芯片。路透社报道,英伟达专为中国市场设计的 AI 芯片 H20 系列已经开始接受经销商的预购,定价几乎与国产的华为 Ascend 910B 一致,但在某些关键领域的 FP32 性能表现却不如华为产品,不过 H20 在互连速度方面似乎比 910B 更具优势。
这并不是一个积极信号。中国是英伟达的第三大市场,销售额占英伟达收入的五分之一。如果在AI芯片市场竞争愈发激烈的关键时刻,中国市场恐将成为英伟达此时最大的变量。
成为一家伟大的公司,并不是只有赚钱那么简单,解决危机和潜在风险的能力也同样重要。未来,英伟达带着市场领先的产品能否傲视群雄,成为行业的绝对霸主?
不难想象,这场算力大战一定精彩绝伦,我们拭目以待。