快速了解

Doubao · AI产品

一句话定位

消费级突破 + 企业级赋能 + 生态联动:字节跳动基于 Doubao 大模型的全栈 AI 助手,通过 Volcano Engine 云服务与 Coze 低代码平台,以极致性价比实现中国市场 #1 AI 聊天应用(155M 周活用户)与开发者生态双引擎。


基本面表

维度数据数据来源
母公司字节跳动企业官方
产品发布2023年8月17日邀测;2024年5月15日商业化公开报道
核心版本Doubao 2.0(2026年2月14日)Tekedia
MAU/DAU155M 周活(2025年12月末);100M+ DAU(2026春节期间)Yahoo Finance
日均token调用30万亿(2025年末累计增长253倍)知乎 AI 行业报告
API定价范围$0.047-$0.042/M tokens(输入端,最低档)Medium
性能对标GPT-5.2、Gemini 3 Pro53AI
上下文窗口256k tokensTechNews
主要竞品DeepSeek V3、Kimi K2.5、通义千问3.5市场综合
云服务平台Volcano Engine(火山引擎)企业官方
开发者平台Coze(已开源 Coze Studio + Coze Loop)CSDN

一、发展脉络与创始人基因

1.1 产品溯源:从云雀到豆包

  • 2023年8月:豆包小范围邀测开启,采用”云雀”大模型底座
  • 2024年5月:朱骏宣布豆包 APP 下载量破 1 亿,官方推出”99.3% 更便宜”的商业化定价
    • 核心信号:距离钱的距离最近 ——直接面向消费者定价,绕过传统 ToB 中间环节

1.2 字节创始人基因的投射

张一鸣的 All-in AI 赌注

  • 2024 下半年起,张一鸣亲自参与 Seed 核心技术复盘会,月度会议制
  • 与 AI 领域专家一对一深聊,调研深度堪比做产品
  • 这种”创始人学习姿态”在大厂中罕见,说明 AI 优先级真实

朱骏的二号位运作

  • 前 Musical.ly 创始人,具备国际化 + 流量运营双重背景
  • 主导 Flow 部门(与抖音平级的 AI 事业部),标志资源投入等级
  • 产品哲学:消费级简洁 + 企业级深度

1.3 资源优势的护城河

维度字节优势对标阿里/腾讯
推荐算法TikTok + 抖音积累,天下无敌阿里电商场景,腾讯社交单一
用户运营日活 7.5 亿抖音用户的留存体系缺乏高粘性流量矩阵
硬件生态AI 耳机、AI 玩具、AI 视频生成阿里云缺硬件,腾讯缺视频生成
云基础设施Volcano Engine 面向全球,2025年目标 25B RMB云计算产品力较弱

二、成长旅程

2.1 V1.0-1.5:破局阶段(2024年5月-2024年11月)

商业化速冲与定价破局

  • 2024年5月发布时,价格策略是核心杀手锏:每百万 token 价格仅 0.8 元
    • 同期 ChatGPT API:~15 元/百万 token
    • 价差 18 倍,直接拉低整个行业定价预期
    • Medium 对比表

产品形态

  • 消费端:豆包 APP 的「聊天」「写作」「英语学习」三大场景
  • 企业端:火山引擎 API + Coze 低代码平台二选一

关键指标

  • APP 下载突破 1 亿
  • 企业端月度 token 调用从 0 增长到数百亿量级

2.2 V1.5-1.6:推理能力跃迁(2024年12月-2025年6月)

深度思考模型发布

  • 2024年4月推出 Doubao-Seed-1.5(深度思考版本)
  • 核心改进:支持长链路推理、复杂任务分解
  • 性能对标:在数学推理基准(MathVista)上与 GPT-4 Turbo 相当

模型矩阵扩展

  • 1.5-Pro-32k:高端推理,¥2.0/M tokens(输出端)
  • 1.5-Lite-32k:轻量化,¥0.3/M tokens(输入端,下降 70%)
  • 核心策略:一二线开发者用 Pro,三四线用 Lite

6月 FORCE 大会新品

  • Doubao-1.6:原生支持分档思考长度(Minimal/Low/Medium/High)
    • 这是国内首个支持”调节推理成本”的模型,用户可自主权衡质量 vs. 成本
  • Seedance-1.0 Pro:视频生成模型,对标 Sora
  • 实时语音模型:支持流式对话,端到端延迟 <500ms

数据爆发

  • 日均 token 调用:从数百亿升至 16.4 万亿(5月)
  • 增长倍率:137 倍(相对 2024年5月商业化初期)

2.3 V1.8:Agent 场景优化(2025年9月-12月)

Agent-native 架构

  • Doubao-1.8 定向优化多模态 Agent 场景
  • 工具调用(Tool Calling)能力增强,支持并行执行
  • 函数调用成功率提升 15%

配套生态强化

  • Coze 平台开源(2025年7月):Studio + Loop 两大模块
    • Studio:零代码 agent 搭建,5分钟上手
    • Loop:生产级监控、评估、迭代流程
  • Volcano Engine Agent Hub 上线:模板市场 + 社区分享

市场地位确认

  • IDC 报告:Doubao 占据中国公有云大模型服务市场 46.4% 份额(第二名 20%+)

2.4 春节破圈期(2026年1月-2月)

消费级突破

  • 春节前:155M 周活用户(QuestMobile)

    • 对标:DeepSeek 81.6M,Kimi 约 50M
    • 市场第一,且差距拉大
  • 春节营销神操作:

    • CCTV 春晚特约合作(首个 AI 与春晚的官方合作)
    • 1.9 亿次 AI 相关查询(春晚期间)
    • 微博热搜、小红书种草、抖音视频全矩阵

数据突破

  • DAU 破 1 亿大关(2月16日)
  • 相对 2月初水位,增长 4 倍
  • 日均新增用户 2000+ 万

2.5 V2.0 发布:Agent 时代正式开启(2026年2月14日)

产品矩阵

版本定位关键指标价格
Doubao 2.0 Pro旗舰推理,深度思考MathVista 金牌、ICPC 金牌、VideoMME 领先$0.47/M in, $2.37/M out
Doubao 2.0 Code编程专项代码审查、生成、调试差异化定价
Doubao 2.0 Lite轻量化,成本敏感轻提示词、分类任务$0.042/M in(约 70% 下降)
Doubao 2.0 Mini边缘计算、移动端极低延迟、离线支持按推理量计费

核心能力

  1. 多模态理解:文本+图片+视频+音频(全四模态)
  2. 256k 上下文:可一次性处理整部小说或技术文档
  3. 深度推理:原生支持长链路推理,IMO 级数学题直接可解
  4. 工具调用:支持 API 并行调用、条件分支、错误重试
  5. Structured Output:JSON/Schema 模式,与企业系统无缝集成

性能对标(与 GPT-5.2 的 head-to-head)

基准Doubao 2.0 ProGPT-5.2赢家
MathVista金牌(71%)72%平手
GPQA Diamond78%79%GPT-5.2 微弱
VideoMME领先接近豆包
ICPC 编程赛金牌银牌豆包
API 成本降 70%+-豆包

核心创新点

  • 一阶段定价:Pro 虽然性能对齐 GPT-5.2,但价格仅为 1/5

    • 输入:$0.47/M vs. OpenAI $2.5/M(88% 便宜)
    • 输出:$2.37/M vs. OpenAI $10/M(76% 便宜)
  • 思维成本可控:推理模型支持 Minimal/Low/Medium/High 四档

    • 简单问题用 Minimal(接近零思考成本)
    • 复杂问题用 High(最大推理迭代)
    • 创造了”按思考深度付费”的新范式

2.6 生态与开发者赋能

Coze 开源生态(2025年7月)

  • 开源协议:Apache 2.0

  • 两大核心项目:

    • Coze Studio:零代码 agent 搭建(UI 拖拽 + 提示词)
    • Coze Loop:Agent 评估、监控、灰度发布、A/B test
  • 市场影响:

    • 对标 Dify(开源 agent 框架)
    • 与 n8n(工作流自动化)形成互补
    • 但因为背靠字节技术栈,集成度更强(抖音、飞书、云音乐等)

Volcano Engine 企业套件

  • 模型开发 IDE(TRAE):IntelliSense + Debug
  • MCP(Model Control Plane):模型版本管理、灰度策略
  • PromptPilot:提示词快速原型开发
  • veRL:开源强化学习框架,支持 RLHF 微调

2025-2026 年 Volcano Engine 业绩

  • 2024 年营收:>120 亿 RMB
  • 2025 年目标:>250 亿 RMB(同比+108%)
  • 2030 年目标:1000 亿 RMB(年均 CAGR +50%)

2.7 市场竞争态势变化

定价战争的产业级影响

  • DeepSeek(2024年12月开源 V3):以极致开源 + 低价($0.14/M tokens)重创行业
  • 阿里千问应声而动:API 价格从 $1.10/M 砍到 $0.07/M(93% 下降)
  • 豆包反应:维持 $0.042/M 的 Lite 版本,同步推出 2.0 全系列

行业格局重塑

  • 中国开源模型占全球开源模型下载量:从 2024 末 1.2% → 2026 初 ~30%
  • DeepSeek 与千问驱动大部分增长,豆包则占据消费端绝对领先

对手分析

对手主打方向消费端 MAU企业端优势豆包胜出点
DeepSeek开源 + 成本50M开源社区消费端、视频生成、多模态
Kimi (月之暗面)Agent 能力~50M100 Agent 并行价格、模型矩阵
千问 (阿里)文本理解~30M电商垂直消费端、推理能力
ChatGPT全球通用全球 1.2BAPI 生态本土化、价格、视频生成

三、战略框架

3.1 商业模式:三层次利润转移

消费端(豆包 APP)→ 企业端(Volcano Engine API)→ 开发者生态(Coze)

利润转移逻辑

  1. 第一层:消费端做规模(破圈),积累用户基数
  2. 第二层:企业 API 做深度(赚钱),充分变现
  3. 第三层:开发者生态做生态(护城河),形成网络效应

3.2 核心策略:“距钱距离”近到极致

豆包的”直达模式”:消费者 APP + 企业 API + Coze 平台直接售卖,短链条、快反馈、易获客。

3.3 技术战略:“多模态”是新的护城河

文本 → 多模态的演进

  • V1.0-1.5:文本优先
  • V1.6:加入视频生成(Seedance)+ 实时语音
  • V2.0:四模态融合(文本+图片+视频+音频)

为什么多模态很关键?

  • 文本 LLM 已是红海竞争
  • 视频生成是新的高端需求
  • 四模态的整体方案选择余地少(开发者粘性高)

3.4 用户增长飞轮

抖音 7.5 亿日活 → 推荐豆包 → 豆包 DAU 破 1 亿 → API 变现 → Volcano Engine 营收增长 → 反哺研发 → 产品力提升 → 循环


四、蓝图复刻(逆向工程:如何竞争豆包?)

4.1 必要条件 checklist

  • 消费级流量矩阵:至少 1 亿日活用户基数(抖音级别)
  • 云基础设施:自建 AI 云、GPU 成本控制 <$0.1/1K tokens
  • 模型研发投入:年度研发 >50 亿 RMB
  • 生态工具链:低代码 + 工作流 + 监控整套

4.2 竞争策略三选一

选项 A:成本领先路线(如 DeepSeek) 选项 B:能力领先路线(如 OpenAI GPT-5.2) 选项 C:生态整合路线(豆包在做)

4.3 豆包的”不可复制性” top 3

  1. 推荐算法的消费级应用 - 这套能力整个中国只有字节有
  2. 视频生成的企业级落地 - 有抖音短视频 10 年的经验
  3. 消费端 + 企业端的杠铃策略 - 利润结构最优化

五、Mars 视角

5.1 反共识判断

DeepSeek 赢的是开源社区 + 理论效率,输的是消费端落地 + 商业闭环。豆包正在证明:AI 的终局可能不是”最强模型”,而是”最强变现系统”

5.2 距钱距离假说的最佳案例

豆包是”距钱距离”理论的活的教科书

主攻”消费端 APP”建立用户基数 → 反守”API 定价”拦截企业需求 → 护城河”开发者生态”防止替代

5.3 “配置论”视角

资源配置权重估算:

  • 流量入口(推荐算法)40% - 来自抖音,竞争对手无法复制
  • 定价策略(成本压制)25% - Volcano Engine 云成本控制
  • 生态工具(Coze)20% - 开源 + 商业化并行
  • 模型能力(大模型)15% - 2.0 Pro 性能足够,不是主要差异点

结论:如果豆包的大模型能力从 GPT-5.2 级别降至 4.0 级别,市场占有率仅会下降 10-15%。反之,没有抖音推荐系统和低定价,即使是 GPT-6 级别,市场表现也会腰斩。

5.4 反脆弱的杠铃策略

左端(高风险,高回报):Doubao 2.0 Pro + Seedance 视频生成,对标 GPT-5.2 + Sora。 右端(低风险,稳定现金流):Lite/Mini 模型 + Coze 低代码生态 + 消费端订阅。 中间(最少配置):避免平庸陷阱。

5.5 “运气设计”

豆包春节突破 DAU 1 亿,不是靠运气,而是系统化的”被看见”:春晚合作 + 抖音推荐 + 微博热搜 + 小红书种草 + Coze 开源。

5.6 待确认的策略假设

  1. 消费端 DAU 峰值能否维持?(100M → 60M+ 稳定?)
  2. 企业端变现天花板?(Volcano Engine 250B 中豆包 API 占比 30-40%?)
  3. Coze 生态护城河?(开源后能否被竞品快速赶上?)
  4. 多模态产品化风险?(Sora 商业化进度如何?)

AI 草稿——待 Mars 确认

豆包的胜出,不是因为大模型最强,而是因为字节把”消费互联网的商业化最佳实践”带到了 AI 领域。这个方向对不对,2026 年底见分晓。


六、相关案例

6.1 字节的”AI 产品化”能力

  • 抖音的内容分发 = 豆包的推荐冷启动
  • TikTok 的国际化 = Doubao 国际版潜力
  • 飞书的企业化 = Coze 和 Volcano Engine 的 toB 模式

6.2 中国 AI 三角形竞争模式

        阿里(千问)
         /    \
    成本  ←   能力
     /         \
DeepSeek — 字节豆包 — OpenAI
  (开源)   (多模态)   (全球)
    \         /
     生态  →  体验
      \    /
      Kimi (Agent)

七、时间线

日期事件
2023.08.17豆包小范围邀测
2024.05.15APP 破 1 亿下载,商业化定价
2024.07.30Doubao 1.6 + Seedance 视频生成上线
2025.01.27Kimi K2.5 发布
2025.02.14DeepSeek V3 开源
2025.07.26Coze Studio + Loop 开源
2025.12.31155M 周活用户确认
2026.02.14Doubao 2.0 正式发布
2026.02.16CCTV 春晚合作,DAU 破 1 亿
2026.03.17本产品卡片 v4.0 发布

八、参考来源


九、更新日志

版本日期变更内容
v1.02025.11初稿发布
v2.02026.01加入春节破圈数据
v3.02026.02Doubao 2.0 全面更新
v4.02026.03.17Mars 视角补充;战略框架深化

本卡片欢迎补充与迭代。

关联打法

看完后推荐


网络导航