媒体报道,在英伟达首席执行官黄仁勋提出打造一家可与亚马逊云服务(Amazon Web Services,AWS)竞争的云服务愿景两年多之后,他已经放弃了与这些公司正面竞争的想法,并在上周对公司的云团队进行了重组。
多位了解此次组织调整情况的人士以及一份内部备忘录披露了这一变化。这些人士对媒体表示,上周向部分员工分享的这份重组备忘录中,对英伟达云业务部门负责人以及多名相关高管进行了重新分工,同时也有一些人离开了公司。
根据备忘录,其中一位高管Alexis Black Bjorlin于2023年从Meta加入英伟达,并直接向黄仁勋汇报,目前正在公司内部寻找新的岗位。英伟达将规模达数百人的云团队并入工程与运营组织,该组织由负责软件工程的高级副总裁Dwight Diercks领导,Diercks同样向黄仁勋汇报。
备忘录及多位曾在该部门工作的人士对媒体称,这支被称为DGX Cloud的云团队,今后将主要服务于英伟达工程师对英伟达芯片的需求,这些芯片用于开发开源AI模型,而不再把重点放在向外部企业客户销售云服务上。
作为重组的一部分,英伟达较新的云服务DGX Cloud Lepton也将并入工程团队。该服务允许云服务商在英伟达运营的一个市场中,列出其未被使用的英伟达服务器算力,但该项目的起步并不顺利。
黄仁勋于2023年3月在英伟达一年一度、面向开发者和客户的旗舰大会上首次发布了DGX Cloud服务。这一举措旨在开辟新的收入来源,并帮助公司与那些从AWS、谷歌和微软等云服务商租用英伟达芯片的AI开发者建立直接联系。
英伟达当时的卖点是,通过DGX Cloud使用芯片,其性能将优于云服务商自身的配置方式。
但在现实中,英伟达担心,随着谷歌、微软和亚马逊各自开发自有AI芯片,它们会降低对英伟达芯片的依赖,并引导客户转向这些替代方案。与AI开发者建立直接关系,被英伟达视为对冲这一风险的重要手段。
这一计划至少在纸面上潜力巨大,英伟达还曾宣传其早期客户,包括ServiceNow、SAP和Amdocs。为了打造云服务,英伟达从大型云服务商那里租用服务器,并按照自身极为严格的标准进行定制,然后再将这些服务器出租给AI开发者。
竞争中的优先级冲突
但多位曾在该部门工作的人士对媒体表示,DGX团队始终难以吸引足够的客户。其中一位人士对媒体指出,由于DGX Cloud实际上运行在AWS等不同云服务商的数据中心中,英伟达在为客户提供故障排查支持方面也面临困难,因为在一家云服务商数据中心做出的修复,可能无法适用于另一家公司的设施。
其中一位人士对媒体表示,黄仁勋也不愿意大幅扩展这一业务,以免惹恼那些本身就是英伟达最大芯片客户的云服务商。同时,英伟达还采取了多项举措,为CoreWeave和Lambda等新兴云服务商提供资金支持,而这些公司的业务实际上与DGX Cloud形成了竞争关系。
英伟达今年早些时候已开始淡出这一尚处早期阶段的云业务。此前公司曾向投资者表示,该业务未来有望创造1500亿美元收入,超过AWS目前的年收入规模。
尽管谷歌等公司试图抢占部分市场份额,英伟达在AI芯片销售领域的绝对主导地位依然稳固。AWS已对其Trainium AI芯片进行大幅降价,并正在与OpenAI讨论一项合作方案,让这家主要使用英伟达芯片的AI开发商也开始使用Trainium芯片。此外,Meta Platforms也在考虑斥资数十亿美元采购谷歌的AI芯片,即张量处理单元(TPU)。
在这些科技公司高度交织的关系中,英伟达本身也已成为最大的英伟达服务器租用方之一,这些服务器由AWS和谷歌等云服务商采购。英伟达一方面尝试将其中部分服务器出租给DGX Cloud客户,另一方面也将这些服务器用于开发多种AI模型,包括机器人和自动驾驶技术相关模型。
英伟达表示,未来几年计划投入260亿美元用于租用此类服务器。
一位英伟达发言人对媒体表示:
“我们将继续投资DGX Cloud,为前沿研发提供世界级的基础设施,并为云合作伙伴提供取得成功所需的软件能力。我们的目标一直是将DGX Cloud作为一个试点项目进行培育,通过它学习如何为生态系统合作伙伴更好地构建系统,这一点并没有改变。”