文|商业范儿

2025年末,一场别开生面的"人机舌战"在社交媒体刷屏。锤子科技创始人罗永浩与字节跳动旗下AI助手豆包就"锤子手机是否好用"展开激辩,豆包以毫秒级响应、情绪化表达和逻辑严密的反驳,让以"辩才"著称的罗永浩直呼"吵出心流"。

在AI应用破圈的标志性时刻背后,豆包也以惊人的速度成长:从2023年8月低调开启邀请测试,到2025年底DAU(日活跃用户)突破1亿,成为国内用户量级最大的AIGC应用。

AI应用正从技术尝鲜走向大规模实用,而豆包凭借独特的技术路径和生态优势,已成为这场变革的领跑者。

人机舌战:豆包的技术底气

2025年倒数第二天,罗永浩暌违7年的"科技春晚"回归之战充满波折——开场迟到47分钟、视频播错、PPT备注未删净、伴奏突然中断。但这场被网友戏称为"灾难级"的年度科技创新分享大会,却因一场不到5分钟的人机辩论重回正轨。

作为辩论正方,罗永浩为自己昔日打造的锤子手机辩护,而豆包以反方身份展开犀利反击,进行了一场关于"锤子手机到底做得好不好"的公开辩论,全程火花四溅。

当罗永浩刚问出"你准备好了吗?",豆包便以"我觉得锤子手机可能不算成功吧"试探性开场,并迅速进入辩论状态。

随后立即被罗永浩抓住逻辑漏洞打断:"我没说成功,我是说做得好,它倒闭了我们都知道的。"

面对打断,豆包迅速调整策略,犀利指出:"‘好’的标准不能只看设计吧,它的硬件品控出了不少问题,比如早期机型的听筒杂音、屏幕漏光"。

当罗永浩转向强调"人机交互好"时,豆包又抛出当年TNT工作站的"灾难性"发布,称其"定价高,还得依赖手机,实际体验根本没达到预期,这不就是华而不实嘛。"现场观众沸腾,罗永浩则略显无奈。


更令人叫绝的是,罗永浩要求豆包模仿王自如在"每句话加一个OK"时,豆包迅速将"OK"自然融入后续对话中,同时继续对锤子手机的缺点展开批评。

最让现场炸裂的一幕是,当罗永浩追问豆包的客观信息来源时,豆包脱口而出"像早期的Zealer"。这一回应直接触发了2014年罗永浩与王自如"Zealer评测论战"的集体记忆,让现场观众笑成一片,罗永浩本人也"绷不住"笑了。

这场完全临场发挥的辩论,不仅展现了豆包的逻辑思辨能力,更颠覆了大众对AI交互的认知:它不再是机械的问答工具,而是能承接情绪、坚守立场、灵活应变的"对话伙伴"。有网友认为,这场辩论拯救了整个晚会,豆包的反应速度和怼人技巧,比很多真人都强。

豆包之所以能在与"语言艺术家"罗永浩的交锋中不落下风,核心源于字节跳动在AI技术上的持续深耕,尤其是在实时交互、上下文理解和拟人性上的突破性进展。

据火山引擎介绍,与罗永浩的"吵架式"辩论,豆包APP调用的是豆包实时语音模型2.0,并基于辩论场景调整了这一模型的系统提示词(System Prompt,模型运行时的"基础规则手册",用于定义模型的行为边界、角色定位和输出规范)。

在这场辩论中,豆包实时语音模型2.0通过底层架构创新,在中文场景下响应延迟低至真人级,摆脱传统AI思考时间长的痛点,真正做到"边想边聊"。

与罗永浩的多轮交锋中,无论对方如何打断、转移话题,豆包都能即时接住对话逻辑,始终紧扣"锤子手机存在硬伤"的核心论点,从品控问题到TNT工作站争议,再到续航发热缺陷,层层递进且不遗漏关键论据,打破了传统大模型"聊崩就失忆"的通病。

这得益于豆包大模型对多轮长上下文理解与指令遵循能力的强化,而在执行"句尾加OK"的指令时,豆包不仅严格遵循,还能根据语境自然融入,避免机械重复,展现了极强的指令深度执行能力。

此外,豆包的"破圈"关键还在于其"有温度的回应":当罗永浩语气激烈时,它会针锋相对;当被质疑"没有手怎么用手机"时,它用"评价电影不用参演"的生活化逻辑巧妙回应;甚至能通过语气变化传递"情绪",让辩论更具张力。

这背后是字节跳动对AI交互的深度打磨。豆包大模型在技术层面采用基于人类反馈的强化学习(RLHF)等多技术路径实现模型迭代;在产品层面将"拟人化"作为核心产品设计原则,从名称、界面到交互逻辑全方位贴近人类沟通习惯;能力层面则构建了包含通用模型、语音识别、语音合成等在内的多模态模型家族,实现情绪承接、幽默表达、逻辑反击的多维交互。

正如字节跳动产品与战略副总裁朱骏所说:"‘拟人化’是大模型产品的新特性……用和人类对齐的交互体验,降低使用门槛,也让用户在使用产品时感觉到产品有类似人的温度。"

据火山引擎披露,豆包实时语音模型2.0已于2025年12月31日在豆包APP上线同款功能"一辩高下"。打开豆包APP,点选"打电话-选择情景-一辩高下",即能体验罗永浩的同款"吵架搭子"。


实际上,字节跳动的豆包大模型家族在多模态理解、生成能力及Agent能力等维度上已位居多个细分赛道的第一梯队。例如,2025年12月18日发布的豆包大模型1.8(Doubao-Seed-1.8)面向多模态Agent场景进行了定向优化,在通用智能体测评集BrowseComp上表现全球领先;在数学与推理等语言模型基础能力维度上,整体水平接近全球顶尖的通用模型。同期发布的音视频生成模型Seedance 1.5 pro,原生支持音视频联合生成,实现毫秒级音画同步输出。

从工具到生态:C端倒灌B端的桥梁

豆包的爆发不仅是字节跳动AI战略持续投入的成果,也可以看作是一个"字节式"产品典型的进化过程。

2023年8月,在ChatGPT点燃全球AI竞赛、国内科技巨头纷纷布局大模型之际,豆包以简洁的对话助手形态开启小范围邀请测试。彼时因"入场稍晚",被行业视为"追随者"。

不过,字节跳动的战略定力在后续逐步显现。2024年5月,火山引擎Force原动力大会上,豆包大模型抛出0.0008元/千Tokens的定价策略,仅为当时市场均价的1%,瞬间引爆行业。

这一"低价穿透"策略并非简单的价格战,而是以极致成本降低开发者与用户的试错门槛。市场反响立竿见影:定价公布后的三个月内,就吸引超50万开发者涌入,豆包API调用量激增300%。

2024年9月,字节跳动发布豆包视频生成模型PixelDance与Seaweed,正式切入AI视频生成赛道。同年底,实时语音交互、AI音乐创作等功能陆续上线,豆包从文本对话工具向多模态助手升级。

2025年成为豆包的爆发期:1月,上线实时语音通话功能;3月上线"深度思考"功能,支持边想边搜;5月推出实时互动视频通话;6月上线AI播客功能;12月,豆包大模型1.8与音视频生成模型Seedance 1.5 pro同步发布,多模态能力再升级。

根据QuestMobile发布的2025年三季度AI应用行业报告,豆包以1.72亿月活用户(MAU),登顶国内AI应用榜首。截至2025年底,豆包DAU突破1亿,成为国内首个达成这一成就的AIGC应用。

豆包能在不到两年半的时间里实现DAU破亿,除了低价策略加速普及外,还在于技术驱动体验升级与生态流量精准灌溉。

一方面,产品定位贴近大众需求。豆包以"拟人化"为核心设计理念,交互门槛极低,覆盖全年龄层用户;功能上聚焦实用场景,从P图、视频生成、文档分析到日程提醒、知识学习、论文阅读等,形成"全场景助手"能力。据极客公园等媒体报道,豆包留存率表现优异,2025年出现180天留存率反超90天留存率的"微笑曲线",印证产品从"技术尝鲜"到"日常使用"的转化。

另一方面,字节跳动生态的全方位赋能。抖音的10亿级流量为豆包提供了天然的增长土壤。同时,字节系产品的协同效应显著,飞书的办公场景、剪映的创作场景、抖音电商的消费场景都为豆包提供了丰富的应用出口,形成"流量-场景-留存"的闭环。

从战略意义上来说,在字节跳动的产品矩阵中,豆包早已超越"AI助手"的单一角色,成为连接C端用户、B端客户与字节生态的核心载体。

作为C端流量新入口,豆包降低了字节跳动对抖音的单一流量依赖。通过嵌入抖音主界面、飞书、剪映、醒图等产品,豆包实现"无处不在"的交互场景,让用户无需专门打开APP即可获得AI服务。这种"环境智能"的布局,使其在获客成本极低的情况下实现自然增长。据媒体报道,字节内部人士透露,豆包在所有破亿DAU的字节产品中,获客成本处于历史最低水平。


作为B端商业化的"敲门砖",豆包以C端验证的技术能力反哺火山引擎。截至2025年12月,中国超过九成主流车企、全球Top10手机厂商中的9家已是火山引擎客户;金融、医药、文娱等百余行业,超过100万家企业与开发者正在其平台上调用豆包大模型能力,其中超过100家企业的累计Tokens使用量已突破一万亿。

作为字节跳动AI生态的"集成平台",豆包整合了字节跳动在内容、算法、工程上的核心优势。豆包从抖音、TikTok汲取多模态训练数据,依托火山引擎的算力网络实现全球调度,再将AI能力反哺给字节系产品,例如剪映的脚本生成、醒图的修图灵感、抖音的电商推荐,都离不开豆包大模型的支撑。这种生态共生形成了强大的护城河,让豆包在AI赛道的竞争中占据独特优势。

虽然豆包承载着字节跳动在AI时代的宏大叙事,但也面临着行业竞争与商业化等多重考验。从机遇来看,市场仍有巨大渗透空间。例如,2026年央视春晚,火山引擎将成为独家AI云合作伙伴,豆包将上线多种AI互动玩法,有望借助这一国民级舞台实现用户量的再次跃升。同时,字节与中兴合作推出搭载豆包手机助手的中兴努比亚M153工程样机,探索"硬件+AI"的全新形态,若能解决与其他超级应用的兼容问题,有望开辟新的增长曲线。此外,豆包正尝试打通"AI+消费"场景,当用户与豆包对话涉及消费话题时,回复中会嵌入抖音商城链接,成为商业化路径的探索之一。

从行业竞争来看,腾讯元宝、阿里千问等竞品加大推广力度,尤其是在AI视频生成、专业领域应用等细分赛道,豆包要保持技术领先的挑战不容忽视。此外,豆包AI手机引发的权限、安全争议,也反映出AI深度融入生活场景时面临的生态秩序挑战。

结语

正如罗永浩在辩论后感慨:"现在如果是辩论或吵架,我试过的所有大模型产品里,豆包是最厉害。"这句话或许不仅是对一个AI助手的评价,更是对一种新交互方式的认可。当AI能够理解情绪、承接语境、参与博弈时,人机关系正在被重新定义。

从实验室的技术模型到数亿用户日常依赖的智能助手,豆包仅用两年多时间就走完了许多互联网产品需要更长时间才能完成的道路。当技术突破遇上恰当的生态位和精准的市场策略,一个国民级AI应用便诞生了。