Replicate

🇺🇸

Replicate, Inc.

AcquiredSan Francisco, California, United Statesreplicate.com
Total funding$57.9M
ConfidenceHigh 20Medium 21Low 8

Company info

Full nameReplicate, Inc.
Founded2019
HeadquartersSan Francisco, California, United States
Websitereplicate.com
Region🇺🇸 United States
StageAcquired
Employees36(YC profile
Report date2026-03-10

Overview

一个面向开发者的 AI model deployment and inference platform,支持通过 API 运行、fine-tune 与部署模型。

Industry tags

AI InfrastructureDeveloper ToolsCloud Inference

Key people

NameRole
Ben FirshmanCo-founder, CEO
Andreas JanssonCo-founder, CTO
Matthew PrinceCo-founder, CEO of Cloudflare (acquirer; post-acquisition strategic owner)
Rita KozlovCloudflare executive co-author on acquisition announcement post
Jared FriedmanPrimary Partner (YC) associated with company profile

Core products and services

Inference API Platform

Replicate API

通过单行 API 调用模型,提供 autoscaling 与 usage-based execution。

High confidence · 2 sources · 2+ independent authoritative sources
Model Marketplace

Model Catalog / Explore

提供可生产部署模型目录与运行记录,支持发现与复用。

High confidence · 2 sources · 2+ independent authoritative sources
Enterprise AI Platform

Replicate Enterprise

提供 enterprise contract/API、security/compliance 控制与托管 GPU 基础设施。

High confidence · 2 sources · 2+ independent authoritative sources
Open-source Packaging Tool

Cog

开源模型打包标准与工具链,提升可复现部署与跨环境一致性。

High confidence · 2 sources · 2+ independent authoritative sources

Funding history

Total funding $57.9M(latest available private-market aggregate)
DateRoundAmountValuationInvestorsConfidence
2023年02月Seed$5.3M(由总额倒算)Previously undisclosed seed, angel investors included Dylan Field and Guillermo RauchHigh confidence · 2 sources · 2+ independent authoritative sources
2023年02月AngelDylan Field, Guillermo RauchMedium confidence · 1 sources · Single authoritative source
2023年02月Series A$12.5MAndreessen Horowitz, Y Combinator, Sequoia, Angel investorsHigh confidence · 2 sources · 2+ independent authoritative sources
2023年12月Series B$40MAndreessen Horowitz, NVentures, Heavybit, Sequoia Capital, Y CombinatorHigh confidence · 2 sources · 2+ independent authoritative sources
2025年11月Strategic InvestmentN/A(private-market tracker)Acquirer: CloudflareHigh confidence · 2 sources · 2+ independent authoritative sources
2025年11月Strategic InvestmentTotal funding raised shown as $57.9M before/at acquisition tracking snapshotHigh confidence · 2 sources · 2+ independent authoritative sources

Product release timeline

2025年05月Medium confidence · 1 sources · Single authoritative source
OpenAI models on Replicate GPT-4.1 / GPT-4o / o-series availability

平台接入最新 OpenAI 模型家族。

2025年03月Medium confidence · 1 sources · Single authoritative source
Wan2.1 API Launch

上线 Wan2.1 text-to-video API 工作流。

2025年01月Medium confidence · 1 sources · Single authoritative source
Video Model Fine-tuning Open-source video fine-tunes

开放开源视频模型 fine-tuning。

2024年10月Medium confidence · 1 sources · Single authoritative source
FLUX FLUX1.1 [pro]

上线 FLUX1.1 [pro]。

2024年09月Medium confidence · 1 sources · Single authoritative source
FLUX Fine-tuning API FLUX.1 LoRA

支持基于自定义图像 fine-tune FLUX.1。

2024年08月Medium confidence · 1 sources · Single authoritative source
FLUX API FLUX.1

上线 FLUX.1 API。

2024年06月Medium confidence · 1 sources · Single authoritative source
Stable Diffusion 3 API Launch

发布 SD3 云端 API 使用路径与指南。

2023年11月Medium confidence · 1 sources · Single authoritative source
Replicate CLI Scaffold command

增加一键脚手架命令以快速创建 Replicate app。

2023年07月Medium confidence · 1 sources · Single authoritative source
Llama 2 API Launch

支持通过 API 运行 Llama 2。

2023年07月Medium confidence · 1 sources · Single authoritative source
SDXL API Launch

支持通过 API 运行 Stable Diffusion XL。

2023年04月Medium confidence · 1 sources · Single authoritative source
Language Models on Replicate Launch

平台新增 language models 类别能力。

2023年02月Medium confidence · 1 sources · Single authoritative source
LoRA Fine-tuning Introducing LoRA

引入 LoRA 流程以支持更快 fine-tuning。

2022年08月Medium confidence · 1 sources · Single authoritative source
Stable Diffusion API Initial

上线 Stable Diffusion API 调用能力。

2022年05月Medium confidence · 1 sources · Single authoritative source
Replicate Platform Initial Public Blog Launch

发布 “Hello, world!” 启动期文章,介绍平台使命与团队。

Key events

2025

创始团队表示交易完成,Replicate 正式并入 Cloudflare。

Cloudflare 宣布将收购 Replicate。

Replicate 表示加入 Cloudflare 后将继续以独立品牌运营。

2024

披露 shared network vulnerability 事件。

2023

宣布 $40M Series B(a16z 领投)。

公布 model pricing 下调 50%。

发布 status page,增强运行透明度。

走出 stealth 并披露累计 $17.8M 融资,市场可见度明显提升。

2022

Stable Diffusion 浪潮带来流量激增,基础设施扩容。

2021

Sequoia 资料指出平台在 2021 年启动。

2020

进入 Y Combinator(Winter 2020)。

2019

Replicate founded。

Competitive landscape

Modal (Modal Inference)

— 以 usage-based serverless compute 为核心,采用按秒计费和免费额度的开发者获客路径,与 Replicate 的开发者首触模式高度重合;其优势在于更广的通用 serverless compute 抽象,而不仅是模型目录分发。

fal (fal API)

— 主打生成式图像/视频的 pay-per-use API,面向 creator 与开发者双侧增长;在生成媒体场景的快速部署与调用上与 Replicate 形成直接替代关系。

Runpod (Runpod Serverless / Instant Clusters)

— 以 serverless + 集群 GPU 市场为主,结合按小时/按秒计费吸引基础设施导向客户;其 GPU 规格与算力选项更强调“底层资源菜单”,而 Replicate 更强调模型层开发体验。

Together AI (Serverless Inference / Dedicated Endpoints)

— 同时覆盖 token-priced inference、dedicated endpoints 与按需 GPU 集群,兼具 API 和 infra 成交路径;在开源模型服务预算上与 Replicate 正面竞争。

Baseten (Baseten Cloud)

— 聚焦 inference engineering 与托管服务,偏向生产级团队与企业交付;在 enterprise 安全与运维控制层面与 Replicate Enterprise 争夺同类预算。

Hugging Face (Inference Providers / Hub)

— 依托大规模社区与模型分发网络,采用订阅与 inference credits 组合商业化;其社区网络效应和发现分发能力构成对 Replicate 开发者心智的长期竞争压力。

AWS (SageMaker)

— 通过企业采购渠道与云平台一体化栈提供按量推理;在“单一云供应商整合”诉求强的客户中,替代 specialized platform 的概率更高。

Google Cloud / Microsoft Azure (Vertex AI / Azure ML)

— 借助大型企业渠道、合规能力与平台捆绑销售,强化端到端平台整合;与 Replicate 在企业可信度、治理能力与平台标准化方面形成竞争。

Growth metrics

Active Users Growth149% month-over-month2023年02月
API Calls Growth125% growth since mid-previous year2023年02月
Enterprise Customer EvidenceNamed customers include Character.ai, Labelbox, Unsplash2023年02月
Model Catalog Size50,000+ production-ready models2025年11月
Team Size362026年03月
Top Model Run Count (platform activity proxy)34M runs shown for top listed model2026年03月

Competitive narrative

Differentiators

以 one-line API 为中心的开发者体验,显著降低 open model 上线门槛。
在收购材料中披露 50,000+ production-ready models,模型覆盖深度构成明显供给优势。
通过开源工具 Cog 形成模型打包与可复现部署标准,强化跨环境迁移能力。
被 Cloudflare 收购后可接入 edge 分发与 Workers AI 生态,增强全球部署与企业化交付能力。

Challenges and risks

公开财务披露有限,ARR/revenue/customer 结构难以外部验证。
Hyperscaler 平台捆绑可能压缩 specialized inference 平台利润空间。
模型原厂 API 直供趋势增强,可能削弱聚合层平台议价能力。
二级市场与私有估值数据不完整,估值与增长质量透明度不足。

Market position

Replicate 在被收购前已建立较强的开发者导向 open-model inference 位置,核心护城河集中在模型可得性、API 易用性与部署抽象层,但经营质量更多通过使用量代理指标体现,财务透明度相对有限。 并入 Cloudflare 后,Replicate 的市场位置从独立 AI infra 创业公司转向平台级能力模块,增长上限更依赖其目录、工具链与工作流在 Cloudflare 生态中的深度整合与交叉分发效率。