Piotr Dąbkowski
这个人最值得记住的是:童年的一个痛点(蹩脚配音),激发了一个企业级解决方案(完美语音合成),现在卖给了全球数千家客服中心。
身份与背景
波兰人,华沙出身。从小看美国电影用波兰配音,那种”配音质量不如原声”的挫败感,在他心里种下了一个种子。
技术路线很经典:Oxford CS → Cambridge Advanced Computer Science(MPhil,深度学习方向)→ Google ML 工程师。
关键经历:Google 的语音合成研究
在 Google 的工作专注于语音合成,这是最”无人关注”但最”需要被解决”的领域。
语音合成的难点不在参数量,而在**“如何让 AI 的声音听起来像人”**。这需要在频谱、韵律、停顿上都精确控制。
ElevenLabs 的创办:与 Mati 的配对
2022 年,Piotr 和童年好友 Mati Staniszewski 启动了 ElevenLabs。Piotr 负责模型,Mati 负责商业。
这是”技术天才 + 商业天才”的经典组合。
不公平优势:本科 + 硕士都在深度学习 + Google 的语音团队经验 + 对产品质量的执念。
关键决策
决策1:『人工不可区分』为目标
行业中很多语音合成产品满足于”能听”,Piotr 的目标是”完全听不出是 AI”。
这个偏执改变了整个产品的调校逻辑。每一个细节都要优化。
决策2:多语言覆盖(29+ 种语言)
语音合成最容易的是英语,最难的是带音调的语言(汉语、日语)。
Piotr 坚持全覆盖,这意味着模型复杂度成倍增加。但这开了全球市场。
决策3:开源语音模型部分权限
与 Mati 的商业策略配合,允许开发者自训练模型。这降低了用户迁移成本,反而增加了粘性。
决策4:从消费到企业的聚焦
ElevenLabs 最初有消费端(阅读工具、播客生成),但 Piotr 和 Mati 很快认识到企业端(客服、内容配音)的利润率更高,集中火力。
产品 DNA
ElevenLabs 的模型设计是 Piotr 的”执念”体现:不追求参数量的庞大,而追求声音质量的极致。
这意味着在 Google 时代学到的”模型精调”技巧被充分应用——每一个语言、每一个声色都有专门优化。
跨语言能力(29 种语言)意味着模型做了大量的多任务学习,这不是简单的”翻译后合成”,而是真正理解每种语言的韵律特性。
现在的 ElevenLabs 能做到 99%+ 的用户分不出是 AI 还是真人配音,这是 Piotr 执念的胜利。
思想特征
核心洞见1:『完美』比『便宜』更值钱
很多 AI 创业者追求”成本最低”。Piotr 追求”质量最高”。
市场证明:企业愿意为”不可区分的质量”多付钱。
核心洞见2:多语言是护城河,不是负担
大多数 ML 工程师认为”多语言增加复杂度”。Piotr 认为”多语言是无法被快速复制的护城河”。
数字快照
| 指标 | 数据 |
|---|---|
| 支持语言 | 29+ |
| 用户分辨不出 AI 的概率 | 99%+ |
| ElevenLabs ARR | $330M |
| 论文引用 | 677(高质量指标) |
相关产品
- ElevenLabs — AI 语音合成平台,CTO
- ElevenLabs VoiceAgent — 企业客服方案
相关人物
- Mati Staniszewski — ElevenLabs CEO,商业搭档
来源与参考
- ElevenLabs 官方博客和技术文档
- Piotr 的学术论文列表