Databricks

🇺🇸

Databricks, Inc.

MatureSan Francisco, California, United Stateswww.databricks.com/
Total funding见 fundingHistory
ConfidenceHigh 12Medium 37Low 0

Company info

Full nameDatabricks, Inc.
Founded2013年
HeadquartersSan Francisco, California, United States
Websitewww.databricks.com/
Region🇺🇸 美国
StageMature
Employees未见公司统一公开口径;第三方常见估计为数千人规模
Report date2026-03-10

Overview

以 lakehouse 为核心、面向企业数据工程、分析、治理与 AI/GenAI 应用开发的一体化数据与 AI 平台公司。

Industry tags

Enterprise SoftwareData PlatformAnalyticsAI InfrastructureGenAI

Key people

NameRole
Ali GhodsiCo-founder, CEO
Matei ZahariaCo-founder, Chief Technologist; original creator of Apache Spark and MLflow
Ion StoicaCo-founder, Board Chair
Andy KonwinskiCo-founder
Patrick WendellCo-founder
Reynold XinCo-founder, Chief Architect
Arsalan Tavakoli-ShirajiCo-founder, SVP Field Engineering
Dave ConteCFO
Andy KofoidPresident, Global Field Operations
Ron GabriskoChief Revenue Officer

Core products and services

8 products
Unified data and AI platform

Databricks Data Intelligence Platform

公司当前主平台定位,统一数据、治理与 AI/自然语言能力。

Medium confidence · 1 sources · Single authoritative source
Lakehouse architecture platform

Lakehouse Platform

Databricks 的核心架构层,将 data lake 与 warehouse 能力统一。

Medium confidence · 1 sources · Single authoritative source
Cloud data warehousing / SQL analytics

Databricks SQL

面向 SQL 分析与数据仓库工作负载的服务层。

Medium confidence · 1 sources · Single authoritative source
AI/GenAI development suite

Mosaic AI

覆盖 model serving、agent framework、gateway、vector search 等 AI 能力。

High confidence · 2 sources · 2+ independent authoritative sources
Governance layer

Unity Catalog

统一管理数据、AI 资产、权限、lineage 与治理策略。

High confidence · 2 sources · 2+ independent authoritative sources
Data engineering / pipeline suite

Lakeflow

统一 jobs、pipelines、CDC 与 connector 的数据工程产品家族。

High confidence · 2 sources · 2+ independent authoritative sources

Funding history

Total funding 见 fundingHistory(公司未统一披露单一口径)
DateRoundAmountValuationInvestorsConfidence
2013年09月Series A$14MAndreessen HorowitzMedium confidence · 1 sources · Single authoritative source
2014年06月Series B$33MNEA, Andreessen HorowitzHigh confidence · 2 sources · 2+ independent authoritative sources
2016年12月Series C$60MNEA, Andreessen HorowitzHigh confidence · 2 sources · 2+ independent authoritative sources
2017年08月Series D$140MAndreessen Horowitz, NEA, Battery VenturesMedium confidence · 1 sources · Single authoritative source
2019年02月Series E$250M$2.75BAndreessen Horowitz, Coatue Management, Green Bay Ventures, Microsoft, NEAMedium confidence · 1 sources · Single authoritative source
2019年10月Series F$400M$6.2BAndreessen Horowitz Late Stage Venture Fund, BlackRock, T. Rowe Price, Tiger GlobalHigh confidence · 2 sources · 2+ independent authoritative sources
2021年02月Series G$1B$28BFranklin Templeton, Canada Pension Plan Investment Board, Fidelity, Whale Rock, strategic participation from AWS, Alphabet, Microsoft, SalesforceMedium confidence · 1 sources · Single authoritative source
2023年09月Strategic Investment$500M$43BNVIDIA, Capital One, existing investorsMedium confidence · 1 sources · Single authoritative source
2024年12月Strategic Investment$10B$62B云启资本Medium confidence · 1 sources · Single authoritative source
2025年09月Strategic Investment$1B超过$100B云启资本Medium confidence · 1 sources · Single authoritative source
2025年12月Strategic Investment超过$4B$134B云启资本Medium confidence · 1 sources · Single authoritative source

Product release timeline

2025年06月High confidence · 2 sources · 2+ independent authoritative sources
Lakebase Public Preview

Lakebase 作为托管 PostgreSQL OLTP 数据库进入 Public Preview。

2025年06月Medium confidence · 1 sources · Single authoritative source
AI Gateway GA

Mosaic AI Gateway 正式 GA,强化模型治理、监控与流量控制。

2025年06月Medium confidence · 1 sources · Single authoritative source
Lakeflow GA

Lakeflow 在 DAIS 2025 公告中被标注为 GA。

2025年06月Medium confidence · 1 sources · Single authoritative source
Databricks AI/BI GA

AI/BI 在 DAIS 2025 公告中被标注为 GA。

2025年06月Medium confidence · 1 sources · Single authoritative source
Databricks Apps GA

Databricks Apps 在 DAIS 2025 公告中被标注为 GA。

2024年06月Medium confidence · 1 sources · Single authoritative source
Databricks Assistant GA

AI 助手正式 GA,用于代码生成、调试、SQL 与文档检索。

2024年06月Medium confidence · 1 sources · Single authoritative source
Lakehouse Monitoring GA

Lakehouse Monitoring 正式 GA。

2024年06月Medium confidence · 1 sources · Single authoritative source
Mosaic AI Agent Framework Public Preview

推出用于构建、部署与评估 RAG/agent 应用的 Agent Framework。

2024年06月Medium confidence · 1 sources · Single authoritative source
Mosaic AI Vector Search Hybrid Search

Vector Search 增加 hybrid keyword-similarity search。

2024年03月Medium confidence · 1 sources · Single authoritative source
DBRX Base / DBRX Instruct

DBRX 模型进入 Mosaic AI Model Serving 可用状态。

2024年03月Medium confidence · 1 sources · Single authoritative source
Foundation Model APIs Provisioned Throughput GA

Foundation Model APIs 的 provisioned throughput 进入 GA。

2019年10月Medium confidence · 1 sources · Single authoritative source
Unified Analytics platform

公开强调平台已整合 Delta Lake、MLflow、Koalas 与 Spark 四大核心组件。

2014年06月Medium confidence · 1 sources · Single authoritative source
Databricks Cloud

首次推出云端大数据处理产品,最初运行在 AWS 上。

Key events

2025

Reuters 报道公司再融资后估值升至 $134B,跻身最具价值私营软件公司之列。

报道显示新融资使公司估值首次突破 $100B。

公司披露年化收入预计到 7 月达到 $3.7B,且同比增长约 50%。

宣布以约 $1B 收购 Neon,将 Postgres/事务数据库能力并入平台战略。

2024

报道显示公司新融资将估值推至 $62B。

宣布收购 Tabular,以强化与 Apache Iceberg 相关的开放湖仓竞争力。

公司披露年化收入将在上半年达到约 $2.4B。

2023

Nvidia 与 Capital One 参与战略融资,估值升至 $43B。

收购生成式 AI 初创公司 MosaicML,补强模型训练与企业 GenAI 能力。

2021

Series G 将公司估值推至 $28B,云生态投资人阵容显著扩大。

与 Google Cloud 推进 BigQuery/GKE 相关集成,强化多云数据平台定位。

2019

Series F 后估值升至 $6.2B,IPO 预期开始明显升温。

2017

完成 Series D 融资,进一步扩张数据科学与企业销售布局。

2016

Ali Ghodsi 在公司早期增长拐点前后接任 CEO。

2013

Databricks 成立。

Competitive landscape

Snowflake (Snowflake Data Cloud)

— 以 SQL-first、消费计费和 data sharing 为核心卖点,go-to-market 更接近标准化企业 data cloud 采购;其优势是易用性与仓库体验成熟,而 Databricks 更强调 lakehouse、数据工程、治理、AI/ML 与 agent 工作流的一体化,因此双方在大型企业主平台采购中正面竞争。 [Source1](https://www.bloomberg.com/news/articles/2024-06-04/snowflake-ceo-seeks-ai-deals-in-competition-with-databricks-microsoft-and-aws) [Source2](https://www.bloomberg.com/news/articles/2025-06-11/databricks-eyes-1-billion-in-sales-for-product-competing-with-snowflake)

Microsoft (Microsoft Fabric)

— 依托 Microsoft 生态、Power BI、Copilot 叙事与企业协议打包销售,更偏 suite-style GTM;其独特优势是 Office/Azure 既有采购链路和 BI 渠道整合,而 Databricks 的优势在跨云与更深的数据工程、AI 平台能力,二者在平台替换与增量部署上形成强分流。 [Source1](https://www.bloomberg.com/news/articles/2025-05-21/microsoft-touts-sales-in-competition-with-snowflake-databricks) [Source2](https://www.infoworld.com/article/4137452/buyers-guide-comparing-the-leading-cloud-data-platforms.html)

Google Cloud (BigQuery)

— 以 serverless analytics、云原生 SQL 和 Google AI 生态为主,采购路径通常跟随 GCP;其优势是低运维和原生查询体验,Databricks 则在开放湖仓、Spark-native 工作负载和 AI/ML 生产链条上更完整,二者在多云分析底座与 AI 数据层上直接竞争。 [Source1](https://www.infoworld.com/article/4137452/buyers-guide-comparing-the-leading-cloud-data-platforms.html) [Source2](https://xenoss.io/blog/snowflake-bigquery-databricks)

Amazon Web Services (Redshift)

— 作为 AWS 原生 data warehouse,Redshift 借助 AWS 账户体系、生态深度与采购便利度取胜,定价和销售模式也更贴近云服务标准采购;相较之下,Databricks 覆盖更广的数据工程和 AI 工作负载,但在纯 warehouse/BI 场景会面对 Redshift 的生态惯性。 [Source1](https://www.infoworld.com/article/4137452/buyers-guide-comparing-the-leading-cloud-data-platforms.html) [Source2](https://xenoss.io/blog/snowflake-bigquery-databricks)

Dremio (Dremio Lakehouse Platform)

— 主打开放 lakehouse、Apache Iceberg 与查询加速,通常以更开放、更查询导向的平台姿态切入;其独特优势是开放格式与性能叙事,Databricks 则用更完整的数据工程、治理与 AI 产品栈对冲,因此两者在开放湖仓路线中存在明确替代关系。 [Source1](https://data.folio3.com/blog/databricks-competitors/) [Source2](https://labelyourdata.com/articles/databricks-competitors)

Starburst (Starburst Enterprise / Galaxy)

— 以 Trino 和联邦查询为核心,强调跨源访问、开放查询层与较灵活的数据虚拟化部署;其商业模式更偏查询与连接层平台,Databricks 则试图把存储、治理、处理与 AI 一并纳入控制面,因此双方在“统一数据访问层”预算中相互竞争。 [Source1](https://data.folio3.com/blog/databricks-competitors/) [Source2](https://labelyourdata.com/articles/databricks-competitors)

Cloudera (Cloudera Data Platform)

— 依托传统大数据客户群与 hybrid deployment 能力,在受监管行业和本地化要求较强场景仍具吸引力;其优势是存量 Hadoop/enterprise data 迁移基础,Databricks 则更适合云原生与 AI 转型项目,因此两者在大型企业现代化改造中形成存量竞争。 [Source1](https://data.folio3.com/blog/databricks-competitors/) [Source2](https://labelyourdata.com/articles/databricks-competitors)

Amazon Web Services (EMR)

— 更偏 Spark/大数据基础设施服务,价格与销售路径直接嵌入 AWS;其优势是基础设施灵活度高、适合已有 AWS 工程团队自管,而 Databricks 提供更高层的平台抽象、治理与协作体验,因此在“自建 Spark 栈 vs 购买统一平台”决策中构成直接替代。 [Source1](https://data.folio3.com/blog/databricks-competitors/) [Source2](https://labelyourdata.com/articles/databricks-competitors)

Growth metrics

ARR超过$100M2019年02月
Revenue run rate$350M约75%2020年10月
Annualized revenue$3.7B50%2025年06月
Customers spending >$10M annually近50家2025年06月
Organizations using Databricks超过15,000家2026年03月
Fortune 500 penetration超过60%2026年03月
Global partners1,200+2026年03月

Competitive narrative

Differentiators

以 Apache Spark、Delta Lake、MLflow 等开源根基切入,再向商业化治理、仓储、AI/agent 层扩张。
多云部署能力强,不被单一 hyperscaler 锁死,适合跨云与大型企业复杂数据版图。
把数据工程、分析、治理、模型服务、agent tooling 放入同一控制面,减少企业栈碎片化。
通过 Unity Catalog 强化统一治理,是其从 analytics vendor 向 enterprise control plane 演进的关键抓手。
并购 MosaicML、Tabular、Neon 后,模型、开放表格式与事务数据库三条战略短板被显著补齐。

Challenges and risks

与 Snowflake、Microsoft Fabric、BigQuery、Redshift 的重叠面持续扩大,价格与采购便利度压力上升。
在强调开放格式和开放生态的同时,仍需证明商业封装不会削弱其开放叙事可信度。
Lakebase、agent 平台和新 AI 产品线需要验证长期采用率,而不只是融资驱动的叙事增强。
公司长期维持私营状态并进行超大额融资,未来 IPO 节奏与二级市场容纳度仍存在不确定性。
围绕 Iceberg、Postgres、AI 应用平台的扩张,会把 Databricks 拉入更多成熟市场的正面竞争。

Market position

Databricks 当前处在企业数据平台从“warehouse vs lake”走向“data + AI operating layer”重构的核心位置。其市场身份已不只是 Spark 商业化公司,而是试图成为企业数据、治理与生成式 AI 的统一底座。 相较纯仓库厂商,Databricks 的优势是工作负载广、开源根基深、AI 叙事完整;相较 hyperscaler 原生套件,它又保持了跨云与相对独立的平台定位。这使其在高端企业账户中具备强议价力,但也意味着要同时应对更广泛的产品战线与更复杂的竞争矩阵。