豆包应用每天有超过2亿用户使用,但截至上半年,其日收入不足百万元,主要来自电商佣金。到今年5月,豆包应用每天消耗数千万元,其中文字聊天成本较低,但推理、图片识别、语音聊天和视频聊天等多模态功能所需的算力成本要贵几倍甚至几十倍。字节跳动计划将2026年的资本开支上调超2000亿元,相当于2025年利润的约六成。
两个月前,字节高层访问了Anthropic后,开始调整AI资源分配,重心从面向大众的产品转向服务企业的产品。过去半年,Anthropic证明了AI编程能让巨额基建投入产生回报,其Claude Code去年5月上线,半年内实现10亿美元年化收入,今年2月翻至25亿美元,估值达到9650亿美元。字节Seedance也证明了企业服务这条路可行,该视频生成模型当前年化收入已达20亿美元(约143亿元),单月超过10亿元,大部分收入来自企业客户。
目前,Seedance毛利率达70%,每卖出10元API调用,服务器和推理成本约占3元。相比之下,语言模型通常有更多版本、更密集的迭代和更长的训练周期,总体训练成本可能是视频模型的3到5倍。Seedance目前主要押注一个视频生成模型,训练投入更容易被后续收入摊薄。近一年优化后,Seedance 2.0成为第一个完整采用MoE的视频生成模型,参数2000亿,预计2026年2月上线后将成为全球性能最强的视频模型。


