Piotr Dąbkowski

这个人最值得记住的是:童年的一个痛点(蹩脚配音),激发了一个企业级解决方案(完美语音合成),现在卖给了全球数千家客服中心。

身份与背景

波兰人,华沙出身。从小看美国电影用波兰配音,那种”配音质量不如原声”的挫败感,在他心里种下了一个种子。

技术路线很经典:Oxford CS → Cambridge Advanced Computer Science(MPhil,深度学习方向)→ Google ML 工程师。

关键经历:Google 的语音合成研究

在 Google 的工作专注于语音合成,这是最”无人关注”但最”需要被解决”的领域。

语音合成的难点不在参数量,而在**“如何让 AI 的声音听起来像人”**。这需要在频谱、韵律、停顿上都精确控制。

ElevenLabs 的创办:与 Mati 的配对

2022 年,Piotr 和童年好友 Mati Staniszewski 启动了 ElevenLabs。Piotr 负责模型,Mati 负责商业。

这是”技术天才 + 商业天才”的经典组合。

不公平优势:本科 + 硕士都在深度学习 + Google 的语音团队经验 + 对产品质量的执念。


关键决策

决策1:『人工不可区分』为目标

行业中很多语音合成产品满足于”能听”,Piotr 的目标是”完全听不出是 AI”。

这个偏执改变了整个产品的调校逻辑。每一个细节都要优化。

决策2:多语言覆盖(29+ 种语言)

语音合成最容易的是英语,最难的是带音调的语言(汉语、日语)。

Piotr 坚持全覆盖,这意味着模型复杂度成倍增加。但这开了全球市场。

决策3:开源语音模型部分权限

与 Mati 的商业策略配合,允许开发者自训练模型。这降低了用户迁移成本,反而增加了粘性。

决策4:从消费到企业的聚焦

ElevenLabs 最初有消费端(阅读工具、播客生成),但 Piotr 和 Mati 很快认识到企业端(客服、内容配音)的利润率更高,集中火力。


产品 DNA

ElevenLabs 的模型设计是 Piotr 的”执念”体现:不追求参数量的庞大,而追求声音质量的极致

这意味着在 Google 时代学到的”模型精调”技巧被充分应用——每一个语言、每一个声色都有专门优化。

跨语言能力(29 种语言)意味着模型做了大量的多任务学习,这不是简单的”翻译后合成”,而是真正理解每种语言的韵律特性。

现在的 ElevenLabs 能做到 99%+ 的用户分不出是 AI 还是真人配音,这是 Piotr 执念的胜利。


思想特征

核心洞见1:『完美』比『便宜』更值钱

很多 AI 创业者追求”成本最低”。Piotr 追求”质量最高”。

市场证明:企业愿意为”不可区分的质量”多付钱。

核心洞见2:多语言是护城河,不是负担

大多数 ML 工程师认为”多语言增加复杂度”。Piotr 认为”多语言是无法被快速复制的护城河”。


数字快照

指标数据
支持语言29+
用户分辨不出 AI 的概率99%+
ElevenLabs ARR$330M
论文引用677(高质量指标)

相关产品

相关人物


来源与参考

  1. ElevenLabs 官方博客和技术文档
  2. Piotr 的学术论文列表