Doubao

快速了解

Doubao · AI产品

一句话定位

消费级突破 + 企业级赋能 + 生态联动：字节跳动基于 Doubao 大模型的全栈 AI 助手，通过 Volcano Engine 云服务与 Coze 低代码平台，以极致性价比实现中国市场 #1 AI 聊天应用（155M 周活用户）与开发者生态双引擎。

基本面表

维度	数据	数据来源
母公司	字节跳动	企业官方
产品发布	2023年8月17日邀测；2024年5月15日商业化	公开报道
核心版本	Doubao 2.0（2026年2月14日）	Tekedia
MAU/DAU	155M 周活（2025年12月末）；100M+ DAU（2026春节期间）	Yahoo Finance
日均token调用	30万亿（2025年末累计增长253倍）	知乎 AI 行业报告
API定价范围	$0.047-$0.042/M tokens（输入端，最低档）	Medium
性能对标	GPT-5.2、Gemini 3 Pro	53AI
上下文窗口	256k tokens	TechNews
主要竞品	DeepSeek V3、Kimi K2.5、通义千问3.5	市场综合
云服务平台	Volcano Engine（火山引擎）	企业官方
开发者平台	Coze（已开源 Coze Studio + Coze Loop）	CSDN

一、发展脉络与创始人基因

1.1 产品溯源：从云雀到豆包

2023年8月：豆包小范围邀测开启，采用”云雀”大模型底座
2024年5月：朱骏宣布豆包 APP 下载量破 1 亿，官方推出”99.3% 更便宜”的商业化定价
- 核心信号：距离钱的距离最近 ——直接面向消费者定价，绕过传统 ToB 中间环节

1.2 字节创始人基因的投射

张一鸣的 All-in AI 赌注

2024 下半年起，张一鸣亲自参与 Seed 核心技术复盘会，月度会议制
与 AI 领域专家一对一深聊，调研深度堪比做产品
这种”创始人学习姿态”在大厂中罕见，说明 AI 优先级真实

朱骏的二号位运作

前 Musical.ly 创始人，具备国际化 + 流量运营双重背景
主导 Flow 部门（与抖音平级的 AI 事业部），标志资源投入等级
产品哲学：消费级简洁 + 企业级深度

1.3 资源优势的护城河

维度	字节优势	对标阿里/腾讯
推荐算法	TikTok + 抖音积累，天下无敌	阿里电商场景，腾讯社交单一
用户运营	日活 7.5 亿抖音用户的留存体系	缺乏高粘性流量矩阵
硬件生态	AI 耳机、AI 玩具、AI 视频生成	阿里云缺硬件，腾讯缺视频生成
云基础设施	Volcano Engine 面向全球，2025年目标 25B RMB	云计算产品力较弱

二、成长旅程

2.1 V1.0-1.5：破局阶段（2024年5月-2024年11月）

商业化速冲与定价破局

2024年5月发布时，价格策略是核心杀手锏：每百万 token 价格仅 0.8 元
- 同期 ChatGPT API：~15 元/百万 token
- 价差 18 倍，直接拉低整个行业定价预期
- Medium 对比表

产品形态

消费端：豆包 APP 的「聊天」「写作」「英语学习」三大场景
企业端：火山引擎 API + Coze 低代码平台二选一

关键指标

APP 下载突破 1 亿
企业端月度 token 调用从 0 增长到数百亿量级

2.2 V1.5-1.6：推理能力跃迁（2024年12月-2025年6月）

深度思考模型发布

2024年4月推出 Doubao-Seed-1.5（深度思考版本）
核心改进：支持长链路推理、复杂任务分解
性能对标：在数学推理基准（MathVista）上与 GPT-4 Turbo 相当

模型矩阵扩展

1.5-Pro-32k：高端推理，¥2.0/M tokens（输出端）
1.5-Lite-32k：轻量化，¥0.3/M tokens（输入端，下降 70%）
核心策略：一二线开发者用 Pro，三四线用 Lite

6月 FORCE 大会新品

Doubao-1.6：原生支持分档思考长度（Minimal/Low/Medium/High）
- 这是国内首个支持”调节推理成本”的模型，用户可自主权衡质量 vs. 成本
Seedance-1.0 Pro：视频生成模型，对标 Sora
实时语音模型：支持流式对话，端到端延迟 <500ms

数据爆发

日均 token 调用：从数百亿升至 16.4 万亿（5月）
增长倍率：137 倍（相对 2024年5月商业化初期）

2.3 V1.8：Agent 场景优化（2025年9月-12月）

Agent-native 架构

Doubao-1.8 定向优化多模态 Agent 场景
工具调用（Tool Calling）能力增强，支持并行执行
函数调用成功率提升 15%

配套生态强化

Coze 平台开源（2025年7月）：Studio + Loop 两大模块
- Studio：零代码 agent 搭建，5分钟上手
- Loop：生产级监控、评估、迭代流程
Volcano Engine Agent Hub 上线：模板市场 + 社区分享

市场地位确认

IDC 报告：Doubao 占据中国公有云大模型服务市场 46.4% 份额（第二名 20%+）

2.4 春节破圈期（2026年1月-2月）

消费级突破

春节前：155M 周活用户（QuestMobile）
- 对标：DeepSeek 81.6M，Kimi 约 50M
- 市场第一，且差距拉大
春节营销神操作：
- CCTV 春晚特约合作（首个 AI 与春晚的官方合作）
- 1.9 亿次 AI 相关查询（春晚期间）
- 微博热搜、小红书种草、抖音视频全矩阵

数据突破

DAU 破 1 亿大关（2月16日）
相对 2月初水位，增长 4 倍
日均新增用户 2000+ 万

2.5 V2.0 发布：Agent 时代正式开启（2026年2月14日）

产品矩阵

版本	定位	关键指标	价格
Doubao 2.0 Pro	旗舰推理，深度思考	MathVista 金牌、ICPC 金牌、VideoMME 领先	$0.47/M in, $2.37/M out
Doubao 2.0 Code	编程专项	代码审查、生成、调试	差异化定价
Doubao 2.0 Lite	轻量化，成本敏感	轻提示词、分类任务	$0.042/M in（约 70% 下降）
Doubao 2.0 Mini	边缘计算、移动端	极低延迟、离线支持	按推理量计费

核心能力

多模态理解：文本+图片+视频+音频（全四模态）
256k 上下文：可一次性处理整部小说或技术文档
深度推理：原生支持长链路推理，IMO 级数学题直接可解
工具调用：支持 API 并行调用、条件分支、错误重试
Structured Output：JSON/Schema 模式，与企业系统无缝集成

性能对标（与 GPT-5.2 的 head-to-head）

基准	Doubao 2.0 Pro	GPT-5.2	赢家
MathVista	金牌（71%)	72%	平手
GPQA Diamond	78%	79%	GPT-5.2 微弱
VideoMME	领先	接近	豆包
ICPC 编程赛	金牌	银牌	豆包
API 成本	降 70%+	-	豆包

核心创新点

一阶段定价：Pro 虽然性能对齐 GPT-5.2，但价格仅为 1/5
- 输入：$0.47/M vs. OpenAI $2.5/M（88% 便宜）
- 输出：$2.37/M vs. OpenAI $10/M（76% 便宜）
思维成本可控：推理模型支持 Minimal/Low/Medium/High 四档
- 简单问题用 Minimal（接近零思考成本）
- 复杂问题用 High（最大推理迭代）
- 创造了”按思考深度付费”的新范式

2.6 生态与开发者赋能

Coze 开源生态（2025年7月）

开源协议：Apache 2.0
两大核心项目：
- Coze Studio：零代码 agent 搭建（UI 拖拽 + 提示词）
- Coze Loop：Agent 评估、监控、灰度发布、A/B test
市场影响：
- 对标 Dify（开源 agent 框架）
- 与 n8n（工作流自动化）形成互补
- 但因为背靠字节技术栈，集成度更强（抖音、飞书、云音乐等）

Volcano Engine 企业套件

模型开发 IDE（TRAE）：IntelliSense + Debug
MCP（Model Control Plane）：模型版本管理、灰度策略
PromptPilot：提示词快速原型开发
veRL：开源强化学习框架，支持 RLHF 微调

2025-2026 年 Volcano Engine 业绩

2024 年营收：>120 亿 RMB
2025 年目标：>250 亿 RMB（同比+108%）
2030 年目标：1000 亿 RMB（年均 CAGR +50%）

2.7 市场竞争态势变化

定价战争的产业级影响

DeepSeek（2024年12月开源 V3）：以极致开源 + 低价（$0.14/M tokens）重创行业
阿里千问应声而动：API 价格从 $1.10/M 砍到 $0.07/M（93% 下降）
豆包反应：维持 $0.042/M 的 Lite 版本，同步推出 2.0 全系列

行业格局重塑

中国开源模型占全球开源模型下载量：从 2024 末 1.2% → 2026 初 ~30%
DeepSeek 与千问驱动大部分增长，豆包则占据消费端绝对领先

对手分析

对手	主打方向	消费端 MAU	企业端优势	豆包胜出点
DeepSeek	开源 + 成本	50M	开源社区	消费端、视频生成、多模态
Kimi (月之暗面)	Agent 能力	~50M	100 Agent 并行	价格、模型矩阵
千问 (阿里)	文本理解	~30M	电商垂直	消费端、推理能力
ChatGPT	全球通用	全球 1.2B	API 生态	本土化、价格、视频生成

三、战略框架

3.1 商业模式：三层次利润转移

消费端（豆包 APP）→ 企业端（Volcano Engine API）→ 开发者生态（Coze）

利润转移逻辑

第一层：消费端做规模（破圈），积累用户基数
第二层：企业 API 做深度（赚钱），充分变现
第三层：开发者生态做生态（护城河），形成网络效应

3.2 核心策略：“距钱距离”近到极致

豆包的”直达模式”：消费者 APP + 企业 API + Coze 平台直接售卖，短链条、快反馈、易获客。

3.3 技术战略：“多模态”是新的护城河

文本 → 多模态的演进

V1.0-1.5：文本优先
V1.6：加入视频生成（Seedance）+ 实时语音
V2.0：四模态融合（文本+图片+视频+音频）

为什么多模态很关键？

文本 LLM 已是红海竞争
视频生成是新的高端需求
四模态的整体方案选择余地少（开发者粘性高）

3.4 用户增长飞轮

抖音 7.5 亿日活 → 推荐豆包 → 豆包 DAU 破 1 亿 → API 变现 → Volcano Engine 营收增长 → 反哺研发 → 产品力提升 → 循环

四、蓝图复刻（逆向工程：如何竞争豆包？）

4.1 必要条件 checklist

消费级流量矩阵：至少 1 亿日活用户基数（抖音级别）
云基础设施：自建 AI 云、GPU 成本控制 <$0.1/1K tokens
模型研发投入：年度研发 >50 亿 RMB
生态工具链：低代码 + 工作流 + 监控整套

4.2 竞争策略三选一

选项 A：成本领先路线（如 DeepSeek） 选项 B：能力领先路线（如 OpenAI GPT-5.2） 选项 C：生态整合路线（豆包在做）

4.3 豆包的”不可复制性” top 3

推荐算法的消费级应用 - 这套能力整个中国只有字节有
视频生成的企业级落地 - 有抖音短视频 10 年的经验
消费端 + 企业端的杠铃策略 - 利润结构最优化

五、Mars 视角

5.1 反共识判断

DeepSeek 赢的是开源社区 + 理论效率，输的是消费端落地 + 商业闭环。豆包正在证明：AI 的终局可能不是”最强模型”，而是”最强变现系统”。

5.2 距钱距离假说的最佳案例

豆包是”距钱距离”理论的活的教科书：

主攻”消费端 APP”建立用户基数 → 反守”API 定价”拦截企业需求 → 护城河”开发者生态”防止替代

5.3 “配置论”视角

资源配置权重估算：

流量入口（推荐算法）40% - 来自抖音，竞争对手无法复制
定价策略（成本压制）25% - Volcano Engine 云成本控制
生态工具（Coze）20% - 开源 + 商业化并行
模型能力（大模型）15% - 2.0 Pro 性能足够，不是主要差异点

结论：如果豆包的大模型能力从 GPT-5.2 级别降至 4.0 级别，市场占有率仅会下降 10-15%。反之，没有抖音推荐系统和低定价，即使是 GPT-6 级别，市场表现也会腰斩。

5.4 反脆弱的杠铃策略

左端（高风险，高回报）：Doubao 2.0 Pro + Seedance 视频生成，对标 GPT-5.2 + Sora。右端（低风险，稳定现金流）：Lite/Mini 模型 + Coze 低代码生态 + 消费端订阅。中间（最少配置）：避免平庸陷阱。

5.5 “运气设计”

豆包春节突破 DAU 1 亿，不是靠运气，而是系统化的”被看见”：春晚合作 + 抖音推荐 + 微博热搜 + 小红书种草 + Coze 开源。

5.6 待确认的策略假设

消费端 DAU 峰值能否维持？（100M → 60M+ 稳定？）
企业端变现天花板？（Volcano Engine 250B 中豆包 API 占比 30-40%？）
Coze 生态护城河？（开源后能否被竞品快速赶上？）
多模态产品化风险？（Sora 商业化进度如何？）

AI 草稿——待 Mars 确认

豆包的胜出，不是因为大模型最强，而是因为字节把”消费互联网的商业化最佳实践”带到了 AI 领域。这个方向对不对，2026 年底见分晓。

六、相关案例

6.1 字节的”AI 产品化”能力

抖音的内容分发 = 豆包的推荐冷启动
TikTok 的国际化 = Doubao 国际版潜力
飞书的企业化 = Coze 和 Volcano Engine 的 toB 模式

6.2 中国 AI 三角形竞争模式

        阿里（千问）
         /    \
    成本  ←   能力
     /         \
DeepSeek — 字节豆包 — OpenAI
  (开源)   (多模态)   (全球)
    \         /
     生态  →  体验
      \    /
      Kimi (Agent)

七、时间线

日期	事件
2023.08.17	豆包小范围邀测
2024.05.15	APP 破 1 亿下载，商业化定价
2024.07.30	Doubao 1.6 + Seedance 视频生成上线
2025.01.27	Kimi K2.5 发布
2025.02.14	DeepSeek V3 开源
2025.07.26	Coze Studio + Loop 开源
2025.12.31	155M 周活用户确认
2026.02.14	Doubao 2.0 正式发布
2026.02.16	CCTV 春晚合作，DAU 破 1 亿
2026.03.17	本产品卡片 v4.0 发布

八、参考来源

九、更新日志

版本	日期	变更内容
v1.0	2025.11	初稿发布
v2.0	2026.01	加入春节破圈数据
v3.0	2026.02	Doubao 2.0 全面更新
v4.0	2026.03.17	Mars 视角补充；战略框架深化

本卡片欢迎补充与迭代。

关联打法

Chat 对话式

看完后推荐

想了解打法？看 Chat 对话式

网络导航

相关产品 → ChatGPT、DeepSeek、Dify、Gemini、Kimi、Trae、n8n

Mars Product Wiki

探索

Doubao

一句话定位

基本面表

一、发展脉络与创始人基因

1.1 产品溯源：从云雀到豆包

1.2 字节创始人基因的投射

1.3 资源优势的护城河

二、成长旅程

2.1 V1.0-1.5：破局阶段（2024年5月-2024年11月）

2.2 V1.5-1.6：推理能力跃迁（2024年12月-2025年6月）

2.3 V1.8：Agent 场景优化（2025年9月-12月）

2.4 春节破圈期（2026年1月-2月）

2.5 V2.0 发布：Agent 时代正式开启（2026年2月14日）

2.6 生态与开发者赋能

2.7 市场竞争态势变化

三、战略框架

3.1 商业模式：三层次利润转移

3.2 核心策略：“距钱距离”近到极致

3.3 技术战略：“多模态”是新的护城河

3.4 用户增长飞轮

四、蓝图复刻（逆向工程：如何竞争豆包？）

4.1 必要条件 checklist

4.2 竞争策略三选一

4.3 豆包的”不可复制性” top 3

五、Mars 视角

5.1 反共识判断

5.2 距钱距离假说的最佳案例

5.3 “配置论”视角

5.4 反脆弱的杠铃策略

5.5 “运气设计”

5.6 待确认的策略假设

AI 草稿——待 Mars 确认

六、相关案例

6.1 字节的”AI 产品化”能力

6.2 中国 AI 三角形竞争模式

七、时间线

八、参考来源

九、更新日志

关联打法

看完后推荐

网络导航

关系图谱

目录