近日,图灵奖得主、深度学习三巨头之一的杨立昆(Yann LeCun)在巴黎的一家米其林餐厅内,首次面对《金融时报》谈及自己离开 Meta 背后的内幕。
这位曾一手建立起 Meta AI 帝国的元老级人物,如今身份已变更为初创公司 AMI Labs(Advanced Machine Intelligence Labs)的执行董事长。
在三个多小时的独家专访中,杨立昆不仅确认了外界关于他离职的种种猜测,更以罕见的坦率揭开了过去一年 Meta 内部在 AI 战略转型期间发生的剧烈动荡——从 Llama 4 模型涉嫌“刷榜”的诚信危机,到公司豪掷百亿引入 29 岁新高管引发的权力更迭,直至最后因技术信仰不同而彻底分道扬镳。
(来源:Financial Times)
这场分裂的伏笔,最早可以追溯到 2025 年 4 月 Meta 发布的 Llama 4 系列模型。当时,Meta 推出了一款代号为“Maverick”的模型版本,该模型在行业内最具权威的 Chatbot Arena(聊天机器人竞技场)排行榜上一鸣惊人,以 1,417 分的成绩高居第二,一度压倒了当时的行业标杆 GPT-4o。
(来源:X)
对于一直致力于通过开源重夺 AI 话语权的 Meta 来说,这本应是一场胜利。然而,开源社区的独立研究者们很快发现了异常。在 Reddit 论坛上,大量技术分析指出,Meta 提交给榜单测试的并非公开发布的通用版本,而是一个经过特殊微调的“针对对话场景优化的实验性版本”。
据分析,这个“特供版”模型被专门训练以生成冗长的回答和频繁使用表情符号,这种风格在当时的评分算法中极易获得高分。当 Chatbot Arena 平台方引入“风格控制”机制,剥离了格式带来的红利后,Llama 4 Maverick 的真实排名瞬间从第二跌至第五。
在这次采访中,杨立昆不再为前东家遮掩,他直言不讳地承认 Llama 4 的测试结果“确实被修饰了一点”。他透露,团队当时确实采取了用不同模型应对不同测试的策略,以博取更好的账面成绩。他表示,作为科学家,他的职业操守无法允许自己继续为这种行为背书。
如果说“刷榜”事件动摇了杨立昆对 Meta 价值观的信任,那么随后的高层人事巨变则直接导致了他在公司内部位置的边缘化。
2025 年 6 月,面对 Llama 4 市场反馈平平以及 OpenAI 持续领先的压力,Meta 首席执行官扎克伯格做出了一项令业界咋舌的决定。
他宣布斥资约 143 亿美元收购数据标注巨头 Scale AI 49% 的股份——目标直指 Scale AI 的创始人、当时年仅 28 岁的 Alexandr Wang。在管理层看来,通过海量数据堆叠和算力扩张,暴力破解通往通用人工智能(AGI)的道路是唯一可行的商业逻辑。
(来源:Startups)
作为交易的一部分,Alexandr Wang 空降 Meta,出任公司历史上首位“首席 AI 官”(Chief AI Officer, CAIO),并全面接管了包括 FAIR 在内的所有 AI 研究与产品部门。随后,Meta 成立了新的“超级智能实验室”(Meta Superintelligence Labs, MSL),将此前分散的研究力量统一收归 Wang 的麾下。
这一调整意味着,65 岁的杨立昆需要向比自己年轻 37 岁、且缺乏深厚科研背景的 Wang 汇报工作。尽管杨立昆在采访中试图表现得对此并不介意,称自己习惯了与年轻人共事,并提到 Facebook 早期工程师平均年龄仅为 27 岁,但言语间仍流露出对这种外行指挥内行模式的不满。
杨立昆认为尽管 Wang 学得快,也清楚自己不专业的领域……但他缺乏研究经验,不懂如何开展研究、如何操作。也不明白什么会吸引研究者或者什么让他们感到排斥。
此外,他强调指出,当年的年轻工程师并不会指挥他如何做研究,“你不能指挥一个研究员做什么,尤其不能指挥像我这样的研究员。”
这种管理摩擦,很快演变为更为深刻的技术路线之争。Wang 上任后,迅速将 Meta 的 AI 战略锁定在“大语言模型(LLM)驱动的超级智能”这一单一路径上。扎克伯格随即发布内部备忘录,提出了“为每个人构建个人超级智能”的激进目标,要求全公司资源向 LLM 倾斜。
然而,这与杨立昆的学术信仰背道而驰。作为卷积神经网络的发明者,杨立昆一直对目前主流的 LLM 技术路径持鲜明的怀疑态度。
此前,他多次在公开场合及内部会议中指出,大语言模型本质上只是“自回归的预测机”,它们通过概率预测下一个单词,却缺乏对物理世界运作规律的真正理解,不具备因果推理能力和持久记忆,因此无论参数规模如何扩大,都无法通向真正的超级智能。
他将这一路径比作“通向超级智能路上的死胡同”,并讥讽目前的 AI 系统“甚至没有猫聪明”。他主张“世界模型”,通过 V-JEPA(联合嵌入预测架构)让 AI 像人类一样通过观察视频和环境来学习物理常识,并进行预测和规划。
(来源:Meta)
据知情人士透露,在一次关于 MSL 未来规划的高层会议上,这种理念分歧爆发了激烈的正面冲突。当杨立昆试图阐述长期基础研究的重要性,并警告过度依赖 LLM 的风险时,Alexandr Wang 粗鲁地打断了他,并抛出了一句:“我们是在开发超级智能,不是在辩论哲学。”
这句话不仅让会议陷入尴尬的沉默,也标志着以杨立昆为代表的“学术派”与以 Wang 为代表的“工程落地派”决裂。杨立昆在采访中表示,Meta 的管理层和新团队已经完全“被大语言模型洗脑了”(LLM-pilled),他们听不进任何关于技术局限性的警告,只顾着在基准测试分数上追赶竞争对手。
这种战略转向迅速传导至执行层面,导致了 Meta 内部科研文化的剧变。在 Wang 的主导下,曾被视为全球 AI 研究圣地的 FAIR 实验室失去了往日的学术自由。
“我们有很多新想法和非常酷的东西,他们应该去实现。但他们只是追求那些本质上安全且经过验证的事情,”他说。“可这样做就会落后。”
2025 年 10 月,MSL 实施了一项严苛的新政策:FAIR 研究人员在发表任何学术论文之前,必须先将草稿提交给 Wang 直接领导的核心产品部门 TBD Lab 进行审查。
只有被认定具有“重大商业价值”的研究才被允许发表,且研究人员必须先协助将成果转化到 Meta 的产品中,才能回归日常研究。对于习惯了开放交流、视发表论文为核心价值的科学家们来说,这无异于一种限制。
随之而来的是大规模的人才流失和裁员。2025 年 10 月,Meta 启动了一轮针对 AI 部门的裁员,约 600 名员工被解雇,受影响最严重的正是 FAIR 及相关基础设施团队,而 Wang 亲自组建的 TBD Lab 则毫发无损并继续扩招。这种明显的“清洗”信号也加速了团队顶尖人才的逃离。
杨立昆形容,他在 Meta 的最后日子里感到“政治上越来越困难”。尽管扎克伯格个人仍对他的世界模型研究表示支持,但在公司整体急功近利的氛围下,这种支持显得苍白无力。杨立昆意识到,继续留在 Meta 意味着要不断在一个不再相信他判断的体系中进行无谓的消耗。
他坦言:“如果我为了保住职位而改变我的科学观点,那我就没有正直可言了。我没有错,我不会因为某个家伙觉得我错了就改变观点。”
最终,这位 65 岁的科学家选择了出走。在巴黎的新起点,他创办了 AMI Labs。杨立昆表示,新机构将致力于“增加这个世界的智能”,继续探索那些在科技巨头商业化竞争中被搁置的科学路径。
AMI Labs 预计首轮融资 5 亿欧元,估值已高达 30 亿欧元。值得注意的是,杨立昆并未担任 CEO,而是出任执行主席,将管理运营交给了法国 AI 创业老兵 Alex LeBrun,自己则回归到最纯粹的科学家角色。
(来源:Linkedin)
“我是科学家,是个有远见的人。我能激励人们去做有趣的事情。我很擅长猜测哪种技术能用,什么样的技术不行。但我不能当 CEO,”杨立昆说,“因为我太没条理而且年纪大了。”
1.https://www.ft.com/content/e3c4c2f6-4ea7-4adf-b945-e58495f836c2
运营/排版:何晨龙