Modal
🇺🇸Modal Labs, Inc.
Company info
Overview
Modal 是面向 AI/ML 的 serverless 计算平台,提供按量付费的 GPU/CPU 基础设施与开发者工具链。
Industry tags
Key people
Core products and services
Modal Inference
按量提供 GPU 推理能力,支持 autoscaling 与低冷启动延迟。
Modal Sandboxes
用于运行不可信代码(LLM/用户代码)的隔离 Sandbox 运行时。
Modal Notebooks
云端协作 notebook,支持自定义镜像、分布式卷与多 GPU。
Modal Training
支持训练与大规模作业调度的 serverless GPU 训练能力。
Modal Batch
面向大规模异步批处理场景,支持百万级输入队列。
Funding history
| Date | Round | Amount | Valuation | Investors | Confidence |
|---|---|---|---|---|---|
| 2023年10月 | Series A | $16M | 未披露 | Redpoint Ventures, Amplify Partners, Lux Capital, Definition Capital | High confidence · 2 sources · 2+ independent authoritative sources |
| 2023年 | Series Seed | 未单独披露(Series A 新闻稿提及 Seed lead 为 Amplify) | 未披露 | Amplify Partners (lead, seed), Lux Capital, Definition Capital | Medium confidence · 1 sources · Single authoritative source |
| 2023年10月 | Milestone (Cumulative Funding) | $23M (total raised to date) | 未披露 | Redpoint, Amplify, Lux, Definition | Medium confidence · 1 sources · Single authoritative source |
| 2024年 | Milestone (Company Stated Total) | Over $110M (company page statement) | 未披露 | Lux Capital, Redpoint Ventures, Amplify Partners, Essence, Definition, Creandum | Medium confidence · 1 sources · Single authoritative source |
| 2025年09月 | Series B | $87M | $1.1B post-money | Lux Capital, existing investors participated | Medium confidence · 1 sources · Single authoritative source |
| 2025年09月 | Milestone (Cumulative Funding) | $111M (total raised to date) | $1.1B post-money | 含 Series A/B 与既有股东 | Medium confidence · 1 sources · Single authoritative source |
| 2026年02月 | Series C (reported, in talks) | 未披露(in talks) | ~$2.5B (reported target valuation) | General Catalyst | Medium confidence · 1 sources · Single authoritative source |
| 2026年02月 | Milestone (Private Market Signal) | N/A | Potential >2x vs prior $1.1B if deal closes | VC syndicate under discussion | Medium confidence · 1 sources · Single authoritative source |
Product release timeline
支持通过 AWS/GCP Marketplace 采购与管理 Modal。
Volumes v2 进入 open beta,JavaScript/Go SDK 进入 beta。
发布 Modal Notebooks,支持协作与多 GPU(最高 8x B200)。
新增 serverless NVIDIA B200/H200 支持,并给出按小时价格。
发布客户端 1.0,强调 API 稳定性与可预测性。
异步作业队列能力提升至单函数最高 100 万输入。
GPU/CPU/内存价格下调最高 65%。
发布 sandbox disk snapshotting、Filesystem API、proxy auth tokens。
Sandboxes 从 beta 进入 GA。
发布 memory snapshotting 升级、OIDC、async job queue 扩展。
推出 static IP proxies、Slack integration、live usage dashboard。
上线 app rollbacks、dynamic batching、sandbox tunnels、OpenTelemetry 等。
发布 WebSocket 支持、interactive commands、H100 支持等。
Modal 平台从 beta 进入 GA。
Key events
TechCrunch 报道其新一轮融资洽谈估值约 $2.5B,General Catalyst 被指在洽谈领投。
宣布 Series B 融资 $87M,Lux Capital 领投。
官方披露 post-money valuation 为 $1.1B。
官方披露累计融资达到 $111M。
完成 SOC 2 Type 2 认证。
与 AWS 签署 Strategic Collaboration Agreement。
合作条款披露包含 AWS Marketplace 上架与 AWS PrivateLink 集成投入。
Tidbyt 团队并入 Modal(官方表述:Tidbyt is joining Modal)。
宣布 Series A 融资 $16M。
官方披露累计融资达到 $23M。
宣布在纽约总部继续扩招工程团队。
公司披露于 2021 年开始构建 Modal。
Competitive landscape
Baseten (Baseten model serving platform)
— Baseten 以企业模型部署和推理 API 为核心,GTM 偏企业销售与生产级托管;在同赛道融资与估值对比中被媒体直接与 Modal 并列,和 Modal 共同竞争企业 AI 推理预算。([Source](https://techcrunch.com/2026/02/11/ai-inference-startup-modal-labs-in-talks-to-raise-at-2-5b-valuation-sources-say/))
Fireworks AI (Fireworks inference cloud)
— Fireworks 走推理云平台路线,以高性能推理与企业化交付争夺中大型客户;其融资加速使其在价格与性能两端都对 Modal 构成直接压力。([Source](https://techcrunch.com/2026/02/11/ai-inference-startup-modal-labs-in-talks-to-raise-at-2-5b-valuation-sources-say/))
Inferact (Commercial inference stack around vLLM)
— Inferact 依托开源推理框架商业化,强调 runtime 技术栈与推理效率,在开发者技术心智和成本敏感场景中可替代 Modal 的部分能力。([Source](https://techcrunch.com/2026/02/11/ai-inference-startup-modal-labs-in-talks-to-raise-at-2-5b-valuation-sources-say/))
RadixArk (Commercialized SGLang stack)
— RadixArk 以 SGLang 生态商业化切入,定位偏性能优化和框架原生体验,在高性能推理与开源社区扩散方面与 Modal 形成竞合。([Source](https://techcrunch.com/2026/02/11/ai-inference-startup-modal-labs-in-talks-to-raise-at-2-5b-valuation-sources-say/))
Runpod (Runpod serverless GPU)
— Runpod 强调低价、按秒计费与丰富 GPU SKU,GTM 偏开发者自助和中小团队快速上线;在价格敏感客群中与 Modal 直接对位。([Source1](https://www.runpod.io/articles/top-serverless-gpu-clouds) [Source2](https://www.36kr.com/p/2796802260938372))
Fal AI (fal serverless inference)
— Fal AI 主打高端 GPU 与生成式 AI 推理性能,服务重性能工作负载;与 Modal 在高性能推理场景和开发者市场存在高度重叠。([Source](https://www.runpod.io/articles/top-serverless-gpu-clouds))
Replicate (Replicate model hosting/API)
— Replicate 以模型 API 易用性和模型生态分发见长,GTM 更偏 API 产品化与快速调用;在模型托管与推理调用层面对 Modal 形成替代。([Source1](https://www.runpod.io/articles/top-serverless-gpu-clouds) [Source2](https://dat1.co/blog/serverless-inference-providers-compared))
beam.cloud (Beam cloud inference)
— Beam.cloud 提供按量付费的 serverless 模型部署与推理能力,面向开发者工作流;在“快速上线 + 用量计费”的价值主张上与 Modal 高度同质竞争。([Source1](https://dat1.co/blog/serverless-inference-providers-compared) [Source2](https://www.runpod.io/articles/top-serverless-gpu-clouds))
Growth metrics
Competitive narrative
Differentiators
Challenges and risks
Market position
Modal 处于 AI-native serverless infra 的第一梯队:在官方披露中已形成多云大规模 GPU 调度能力,并通过 Sandboxes、Notebooks、Batch、Inference 组合覆盖从研发到生产的主路径。其 2025 年 Series B 后达到 $1.1B 估值,显示资本市场将其视为推理与 AI 应用基础设施的核心受益者之一。 同时,赛道竞争从“通用云替代”转向“推理效率与开发者心智”争夺。Baseten、Fireworks、Runpod、Replicate 等分别在企业推理、API 分发、低价 GPU 与生态优势上形成分层竞争。Modal 的中期胜负手将取决于性能/成本持续优化、企业渠道放大(Marketplace + PrivateLink)、以及开发者工作流粘性。