Twelve Labs
🇺🇸Twelve Labs, Inc.
Company info
Overview
全球领先的视频理解AI公司,提供多模态视频原生基础模型,通过API使开发者和企业能够像人类一样搜索、分析和理解视频内容。
Industry tags
Key people
Core products and services
TwelveLabs Video Understanding Platform
企业级视频智能平台,通过API提供视频搜索、分析、生成摘要和自动化工作流
Funding history
| Date | Round | Amount | Valuation | Investors | Confidence |
|---|---|---|---|---|---|
| 2022年03月 | Seed | $5M | 未披露 | Index Ventures Lead, Radical Ventures | High confidence · 2 sources · 2+ independent authoritative sources |
| 2022年12月 | Seed+ | $12M | 未披露 | Index Ventures, Radical Ventures, WndrCo, Korea Investment Partners Lead | High confidence · 2 sources · 2+ independent authoritative sources |
| 2023年10月 | Strategic Investment | ~$10M | 未披露 | NVIDIA NVentures, Index Ventures, Radical Ventures, WndrCo, Korea Investment Partners Lead | High confidence · 2 sources · 2+ independent authoritative sources |
| 2024年06月 | Series A | $50M | $2~3亿美元 (estimated) | New Enterprise Associates Lead, NVIDIA NVentures Lead, Index Ventures, Radical Ventures, WndrCo, Korea Investment Partners | High confidence · 4 sources · 2+ independent authoritative sources |
| 2024年12月 | Strategic Investment | $30M | 未披露 | Databricks, SK Telecom, Snowflake Ventures, HubSpot Ventures, In-Q-Tel (IQT) Lead | High confidence · 2 sources · 2+ independent authoritative sources |
Product release timeline
发布 Marengo 2.7,引入全新多向量(multi-vector)视频理解方法
Marengo 2.6 版本正式发布(GA),提升视频搜索精度和索引效率
发布 Pegasus 视频转文本模型(约170亿参数),可将视频内容转化为结构化文本
发布 Marengo 基础模型,支持多模态视频搜索与索引,15分钟可索引1小时视频
首次对外发布视频理解API平台,支持基本的视频语义搜索功能
Key events
Databricks、Snowflake、SK Telecom、HubSpot Ventures 和 In-Q-Tel(IQT) 进行 $30M 战略投资,标志着企业级数据基础设施巨头对视频理解技术的认可
聘请 Yoon Kim 担任总裁(President),曾任 SK Telecom CTO 及 Apple Siri 负责人
完成 $50M Series A 融资,由 NEA 和 NVIDIA NVentures 联合领投,计划年底前将团队规模扩大一倍(新增50+人)
年收入达到 $4.2M~$4.5M,团队从约60人增长至109人(YoY +82.1%)
NVIDIA NVentures 首次投资 Twelve Labs,成为 NVIDIA 在韩裔 GenAI 创业公司中的首笔投资
完成 $5M 种子轮融资,由 Index Ventures 领投,正式开启商业化进程
Competitive landscape
NVIDIA 深度合作
作为 NVIDIA NVentures 在韩裔 GenAI 创业公司中的首笔投资,享有GPU资源和技术支持优势
数据基础设施巨头背书
Databricks、Snowflake 的战略投资意味着未来与数据湖仓生态的深度整合
Google (Vertex AI Video Intelligence / Gemini)
— 依托 Google Cloud 生态,提供预训练视频分析API(物体检测、OCR、内容审核等),Gemini 多模态模型也具备视频理解能力。优势在于庞大的云客户基数和基础设施规模
Microsoft (Azure Video Indexer)
— 整合于 Azure 云平台,提供视频转录、人脸识别、场景检测等功能,企业客户可通过现有 Azure 订阅无缝接入
Amazon (Rekognition Video)
— AWS 生态下的视频分析服务,聚焦安防监控、内容审核等场景,价格竞争力较强
Clarifai
— 老牌计算机视觉平台,提供视频和图像识别API,业务覆盖面更广但视频专注度不及 Twelve Labs
Mux
— 视频基础设施公司,提供视频分析和流媒体解决方案,更偏向视频传输层而非语义理解层
OpenAI (GPT-4o / GPT-5)
— 多模态模型具备视频帧理解能力,但非原生视频理解,尚未提供专门的视频索引和搜索API
Google DeepMind (Gemini 3)
— 原生多模态模型支持长视频理解(百万token上下文窗口),是 Twelve Labs 在技术前沿面临的最大挑战
Anthropic (Claude)
— 多模态能力不断增强,但目前视频理解能力相对有限
视频原生架构
Twelve Labs 自研的 Marengo 和 Pegasus 模型从底层专为视频理解而设计,而非在文本/图像模型上扩展视频能力
多模态融合搜索
同时理解视频中的声音、文字、画面、动作等多维信息,支持跨模态语义搜索
索引效率
15分钟可索引1小时视频,适合大规模视频库的企业级应用
顶级顾问团队
拥有李飞飞(ImageNet 创始人)、Silvio Savarese(斯坦福教授)和 Jeffrey Katzenberg(好莱坞资深人士)的顾问支持
大模型平台化挤压
Google Gemini、OpenAI GPT-5 等通用多模态模型的视频理解能力持续增强,可能侵蚀专用视频理解API的市场空间
收入规模偏小
2023年收入仅 $4.2M,相对于 $107M 的融资总额,商业化进展仍处早期阶段
人才竞争
AI领域人才争夺激烈,109人团队需持续扩张以支撑研发和商业化双线推进
技术护城河可持续性
随着开源多模态模型(如 Meta Llama 4 Scout)快速进步,专有模型的技术壁垒面临持续挑战
Growth metrics
Competitive narrative
Differentiators
Challenges and risks
Market position
Twelve Labs 是全球视频理解AI领域的先行者和技术领导者。在一个被 Google、Microsoft、Amazon 等大型云厂商间接覆盖的市场中,Twelve Labs 凭借"视频原生"的技术路线和专注度,在企业级视频语义搜索和分析这一垂直赛道占据了独特位置。2024年6月 Series A 融资后估值约 $2~3亿美元,加上12月获得 Databricks、Snowflake 等数据基础设施巨头的 $30M 战略投资,显示出行业对其技术方向的高度认可。 公司的客户主要集中在媒体娱乐(专业体育联赛、影视制作工作室)、内容创作者以及安防监控等领域。LinkedIn 数据显示员工数量在过去一年增长 82.1%,反映出团队的快速扩张态势。然而,$4.2M 的年收入与 $107M 的融资规模之间存在显著差距,表明公司仍处于产品市场契合度(PMF)验证和规模化的早期阶段。