记者丨孔海丽 彭新

编辑丨张伟贤

视频丨王学权

1月10日,在由清华大学基础模型北京市重点实验室、智谱AI发起的AGI-Next前沿峰会上,中国“基模四杰”罕见集齐:腾讯“CEO/总裁办公室”首席AI科学家姚顺雨、Kimi创始人杨植麟、智谱创始人唐杰、阿里巴巴Qwen技术负责人林俊旸,以及加拿大皇家学院院士、香港科技大学荣休教授杨强等AI界知名大咖,围绕AI新范式、Agent、中国大模型公司的挑战及机会等话题展开了讨论。

其中,杨植麟首次深度分享了Kimi的技术重点,他透露,2025年,月之暗面的两个技术进化主线是提升“TokenEfficiency”,以在有限的数据下冲击更高的智能上限;以及扩展“长上下文”能力,以满足Agentic时代越来越长程的任务对模型的记忆能力需求。


履新腾讯后,姚顺雨首次公开亮相

值得注意的是,此次峰会是姚顺雨加入腾讯后,首次对外界分享其对AI产业的观察。现年27岁的姚顺雨毕业于清华大学姚班和普林斯顿大学。他在2024年加入OpenAI后,迅速成为团队核心研究者之一,参与推动 AI Agent和任务执行系统方向的开发。

2025年12月17日,腾讯宣布升级大模型研发架构,新成立AI Infra部、AI Data部和数据计算平台部,旨在全面强化大模型的研发体系与核心能力。其中,姚顺雨出任“CEO/总裁办公室”首席AI科学家,向腾讯总裁刘炽平汇报;同时兼任AI Infra部、大语言模型部负责人。

姚顺雨指出,当前中美大模型市场均呈现出明显的分化特征,其中To C与To B市场的底层逻辑已截然不同。“对于To C市场,大部分用户在大部分时间并不需要极强的智能。”姚顺雨表示,虽然当前模型在数学推导等高阶能力上显著增强,但对于普通用户而言,ChatGPT等应用更多是“搜索引擎的加强版”。在这一领域,为了提供更好的体验,厂商倾向于走“垂直整合”路线,即模型层与应用层紧密耦合、快速迭代。

而在To B领域,逻辑则完全相反。“智能越高,代表生产力越高,溢价空间也越大。”姚顺雨观察到,企业级市场对模型能力的付费意愿呈现极端的头部效应。他举例称,市场愿意为顶级模型支付200美元/月的订阅费用,而对次级模型(50美元或20美元/月)兴趣寥寥。对此,姚顺雨称在编程等高频且严肃的生产力场景中,较弱模型产生的错误需要人工耗费大量精力去排查和监控,其隐性成本远超模型差价。因此,To B市场正走向分化,强模型和较弱模型的差距将更加明显。

进一步来看,姚顺雨认为,单纯的模型参数竞赛已不是C端产品的全部,未来的核心竞争力在于对“语境”(Context)的捕捉。“比如问‘今天吃什么’,今年问和去年问,答案不应一样。”姚顺雨解释道,更好的回答不单纯依赖更强的推理能力,而在于模型是否掌握用户的实时状态、位置、历史偏好甚至社交关系等“额外的Context”。

在To B端,鉴于国内企业软件市场付费意愿较弱的现实,姚顺雨提出大型科技公司应利用自身庞大的内部场景进行验证。与初创公司依赖外部标注商不同,一家拥有10万员工的大厂本身就是巨大的实验场。“怎么把真实世界的数据利用好,而不是仅仅依赖于标注商或者外部采购。”


下一代AI范式是什么?

谈及自主学习的发展信号,姚顺雨提出了不同于普遍认知的观点,他认为2025年就已出现相关信号,部分团队正采用最新用户数据进行实时学习,新模型也在真实环境数据的支撑下开展训练。不过这些尝试尚未带来石破天惊的效果,核心原因在于其缺乏预训练能力,模型表现暂时不及OpenAI等头部公司的产品。

姚顺雨认为,自主学习发展面临的最大问题并非技术本身,而是“想象力”的缺失。他说,我们能够大致构想强化学习或推理范式落地后的形态,比如chatGPT O1模型通过强化学习与思维链,将数学题得分从10分提升至80分,但对于自主学习真正实现时该呈现怎样的具体任务与效果,尚未形成清晰认知。他举例说明,无论是能盈利的交易系统,还是能攻克人类未解科学难题的工具,只有明确了这些具象化的目标,才能真正判定新范式的到来。

当被问及2027年哪家公司最有可能实现新范式创新时,姚顺雨认为OpenAI的概率还是更大。尽管他坦言商业化等因素已在一定程度上削弱了OpenAI的创新基因,但综合来看,OpenAI依然是全球范围内最有可能诞生新范式的企业。

林俊旸从更务实的角度切入,他认为当前RL(强化学习)的潜力尚未充分释放,相关探索仍处于早期阶段,全球范围内都存在类似的发展瓶颈。对于下一代AI范式,他提出了两个核心方向。

其一,AI的自主进化。他提到有观点认为,人类与AI的持续交互只会让上下文不断拉长,反而导致AI“变笨”,这一现象值得深思。而实现自主进化是否需要更新模型参数,行业内可采用不同技术路径达成,暂无统一答案。

其二,AI的主动性提升。当前AI的启动与运行高度依赖人类协助,未来能否实现自主思考、主动行动,是新范式的重要特征。但这一方向也潜藏着严峻的安全风险,他特别强调,担忧的并非AI“说不该说的话”,而是其可能主动实施危险行为,比如产生伤害他人的想法并付诸行动。因此,如同培养孩子一般为AI注入正确导向,是发展主动性过程中不可或缺的环节。

关于自主学习的落地场景,林俊旸认为自动化AI研究员的实现或许无需依赖自主学习,短期内即可替代人工完成模型训练工作;而持续理解用户需求、实现个性化交互,更有可能成为自主学习的首个突破口。

对于2026年Memory技术能否实现突破性跨越,林俊旸表示,技术本质上呈线性发展,所谓“突破性”更多是人类的主观感受。目前Memory技术仅能让AI记住过往信息,却无法像人类一样深度理解运用。

林俊旸预测,Memory技术可能还需一年左右发展,当算法与基础设施实现更好融合,或许能达到“临界点”,让人类感受到类似人与人之间的记忆理解能力。

唐杰对2026年AI范式革新充满信心,他认为持续学习、Memory、多模态等方向均有望诞生新范式。而新范式的出现,核心驱动力源于两大趋势。

一方面,学术界与工业界的创新差距显著缩小。此前工业界在大模型领域遥遥领先,2023-2024年时,工业界拥有上万片算力卡,而高校往往仅有0片或1片,差距高达万倍;但到2025年底至2026年初,众多高校已配备充足算力卡,不少老师及硅谷学者纷纷投身大模型架构、持续学习等领域研究,尽管当前双方差距仍有10倍,但学术界已孵化出创新种子,具备了突破的潜力。

另一方面,大模型发展面临效率瓶颈。当前行业在大模型领域投入巨大,但效率低下的问题日益凸显。数据规模从2025年初的10TB增长至当前30TB,未来甚至可能扩展到100TB,但规模扩张带来的收益与高昂的计算成本不成正比,盲目投入10亿、20亿资金可能仅获微薄回报。同时,反复重训基座模型、过度依赖RL的模式,收益已逐渐递减。因此,未来需明确“智能效率”(Intelligence efficiency)的核心地位,即在更少投入下实现更大的智能增量,这种对效率的追求将倒逼新范式诞生。

唐杰透露,其团队也在积极投身相关研究,期待成为新范式的推动者,但也坦言创新结果存在不确定性。


AI Agent今年如何走?

除了模型本身的演进,AI Agent(智能体)发展走向被视为2026年AI产业的关键变化。

对于Agent的发展阶段,杨强提出了四阶段演进框架:从目标和规划均由人类定义,过渡到AI自动定义。他认为,当前的Agent系统仍处于初级阶段,大部分依赖人工设定目标和规划;未来将出现原生系统,即大模型将能够观察人类工作,自主利用数据,内生地定义目标与规划路径。

林俊旸指出,通用Agent的核心能力在于解决长尾问题。他指出,解决头部需求相对容易,但解决长尾需求极难,而今天AGI(通用人工智能)的价值,恰恰在于能解决用户“到处找不到答案”的难题。

对于Agent领域,创业者与大模型公司的竞争问题,林俊旸直言这一问题“见仁见智”。他表示,如果创业者“善于套壳”,在产品化上能做得比模型公司更好,仍有创业机会;但对于模型公司而言,其优势在于践行模型即产品原则,遇到问题时,可以通过重训模型、消耗算力来从底层解决。

然而,Agent商业化落地的现实挑战依存在。唐杰指出了决定Agent的三个核心要素:价值、成本(Cost)与速度。他强调,首先要看Agent是否解决了真正有价值的人类事务;其次是成本问题,“如果调一个API就能解决问题,但Agent的成本特别大,那就构成了矛盾”。

SFC

出品丨21财经客户端 21世纪经济报道

编辑丨刘雪莹

21君荐读