Together AI

🇺🇸

Together Computer Inc.

Growth美国, 旧金山(San Francisco, CAwww.together.ai
Total funding$533.5M
ConfidenceHigh 19Medium 15Low 0

Company info

Full nameTogether Computer Inc.
Founded2022年06月
Headquarters美国, 旧金山(San Francisco, CA
Websitewww.together.ai
Region🇺🇸 USA
StageGrowth
Employees~200
Report date2026-03-10

Overview

专注于开源生成式 AI 的全栈云基础设施平台,提供模型推理、微调、训练及 GPU 集群服务

Industry tags

AICloud

Key people

NameRole
Vipul Ved PrakashFounder, CEO
Ce ZhangCo-founder, CTO
Chris RéCo-founder
Percy LiangCo-founder
Tri DaoChief Scientist

Core products and services

Cloud / API / SaaS

Together AI Platform

全栈 AI 云平台,支持 200+ 开源模型的推理、微调、训练及 GPU 集群部署

  • **Inference API**:支持无服务器(Serverless)和专用端点(Dedicated Endpoints)部署,兼容 200+ 开源模型(Llama、Mixtral、DBRX 等),支持企业级 VPC 运行
  • **Model Fine-Tuning**:支持全量微调和 LoRA 低秩适应微调,用户完全拥有微调后模型,无供应商锁定
  • **GPU Cluster Training**:提供 GB200、H200、H100 等高端 NVIDIA GPU 集群,支持大规模预训练和自定义模型从零构建
  • **ATLAS**:运行时自适应学习加速器(Adaptive Learning Speculator System),实现高达 4x 的 LLM 推理加速
  • **Together Instant Clusters**:自助式 NVIDIA GPU 集群服务,按需即用,已全面可用(GA)
  • **Batch Inference API**:批量推理接口,大多数模型可降低 50% 推理成本
  • **Code Interpreter**:通过收购 CodeSandbox 集成的代码执行和调试环境
High confidence · 4 sources · 2+ independent authoritative sources
Web IDE

CodeSandbox

在线代码开发平台(4.5M MAU),被收购后集成为平台代码解释器功能

High confidence · 2 sources · 2+ independent authoritative sources

Funding history

Total funding $533.5M 🟢 2源
DateRoundAmountValuationInvestorsConfidence
2023年05月Seed$20MLux Capital Lead, Emergence CapitalHigh confidence · 3 sources · 2+ independent authoritative sources
2023年11月Series A$102.5MKleiner Perkins Lead, NVIDIA Lead, Emergence Capital, Prosperity7, Lux CapitalHigh confidence · 3 sources · 2+ independent authoritative sources
2024年03月Series A+$106M$1.25BSalesforce Ventures Lead, Coatue Management, Lux Capital, Emergence CapitalHigh confidence · 3 sources · 2+ independent authoritative sources
2025年02月Series B$305M$3.3BGeneral Catalyst Lead, Prosperity7 Ventures Lead, Salesforce Ventures, NVIDIA, Kleiner Perkins, Coatue ManagementHigh confidence · 3 sources · 2+ independent authoritative sources

Product release timeline

2025年09月Medium confidence · 1 sources · Single authoritative source
Together AI Platform Fine-Tuning v2

微调平台升级:支持更大规模模型和更长上下文窗口

2025年Medium confidence · 1 sources · Single authoritative source
Together AI Platform ATLAS

ATLAS 运行时学习加速器发布,实现高达 4x 的 LLM 推理加速

2025年Medium confidence · 1 sources · Single authoritative source
Together AI Platform Instant Clusters GA

Together Instant Clusters 自助式 NVIDIA GPU 集群全面可用

2025年Medium confidence · 1 sources · Single authoritative source
Together AI Platform Batch API v2

批量推理 API 更新,大多数模型降低 50% 推理成本

2024年12月High confidence · 2 sources · 2+ independent authoritative sources
Together AI Platform Code Interpreter

通过收购 CodeSandbox 集成代码解释器功能,支持浏览器内代码执行

2024年Medium confidence · 1 sources · Single authoritative source
Together AI Platform Enterprise

企业平台上线 AWS Marketplace,支持企业级部署和采购

2023年03月Medium confidence · 1 sources · Single authoritative source
Together AI Platform OpenChatKit 0.15

首款开源聊天机器人框架,完全开放源代码和训练数据集,面向开发者社区

Key events

2026

举办首届 AI Native Conf,宣布 10x ACR 同比增长、100 万+ 开发者用户

2025

马里兰州(Maryland)自有数据中心上线运营,标志着从 GPU 租赁向自有基础设施转型

年化营收突破 $100M,较一年前的 $30M 增长超 3 倍

收购 Refuel.AI,扩展数据标注和模型评估能力

与 Cartesia 合作集成语音功能,扩展多模态能力

2024

收购在线开发平台 CodeSandbox(月活 4.5M 用户),集成为平台代码解释器功能

估值突破 $1.25B,正式成为独角兽公司

2023

入选 Fortune 全球 AI 创新者 50 强(Global Artificial Intelligence Innovators)

Competitive landscape

CoreWeave

— 领先的专业化 GPU 云基础设施提供商,已完成 IPO,市值远超 Together AI,提供大规模 NVIDIA GPU 集群(含 InfiniBand 高速互联),重点服务 AI 训练和推理的超大规模客户

Lambda Labs

— 面向开发者和研究人员的 GPU 云服务,提供 H100/B200 GPU 按分钟计费、零出站费用,企业级合规与安全认证,定价 H100 约 $2.99/hr

Fireworks AI

— 由前 Meta PyTorch 核心团队创立,专注于高吞吐量低延迟推理,在推理速度和开发者体验方面与 Together AI 直接竞争

Anyscale

— 基于 Ray 分布式计算框架的 AI 部署平台,支持云端和本地灵活部署,由 Ray 开源项目原团队创立

DeepInfra

— 主打极致低成本的开源模型推理服务,在价格方面对 Together AI 构成压力

Groq

— 自研 LPU(Language Processing Unit)定制芯片,推理速度比 GPU 平台快 10x 以上,但模型生态和灵活性有限

Cerebras

— 晶圆级引擎(Wafer-Scale Engine),在大规模 LLM 训练和科学计算方面性能卓越,走差异化硬件路线

RunPod

— 面向个人开发者和小团队的平价 GPU 云,支持按需和预留实例

Vast.ai

— 去中心化 GPU 算力市场,价格最低但服务稳定性较差

Modal

— 无服务器 GPU 计算平台,专注开发者体验和快速部署

研究驱动型公司

核心团队创造了 FlashAttention(Tri Dao,已成为 LLM 训练的行业标准)、Red Pajama(主流开源训练数据集)等基础设施级技术

学术阵容顶尖

4 位联合创始人中 3 位为 Stanford / ETH Zurich 的顶级 AI 学术研究者,技术深度在同类公司中无出其右

全栈产品覆盖

同时提供推理 API、模型微调、预训练和 GPU 集群,一站式解决 AI 基础设施需求,区别于仅提供单一服务的竞品

开源优先策略

支持 200+ 开源模型,用户完全拥有微调后模型、无供应商锁定,与闭源云厂商形成鲜明差异

自有数据中心

正从 GPU 租赁(CoreWeave / Lambda)转向自有数据中心运营(马里兰已上线、孟菲斯在建),预计显著改善毛利率

GPU 供应链风险

高度依赖 NVIDIA 芯片供应,全球 GPU 短缺可能限制服务扩展和数据中心建设

超大规模云价格战

AWS 已将 H100 价格下调 44%(2025 年 6 月),传统云巨头持续压缩专业化提供商的利润空间

定制芯片颠覆威胁

Groq、Cerebras 等定制芯片在推理速度方面具有 10x+ 结构性优势,可能重塑推理市场格局

客户集中度风险

营收主要来自 AI 初创公司和 SaaS 企业,若 AI 投资热潮降温可能影响客户支付能力和留存

自建数据中心资本密集

从轻资产租赁模式转向重资产自有数据中心,需要大量前期资本投入,增加财务杠杆

开源模型商品化

随着 Llama、Mistral 等开源模型质量趋同,纯推理 API 服务面临严重的商品化和价格战压力

Growth metrics

Revenue (Annualized)$300M2025年09月
Revenue Growth Rate400% YoY2024年
ACR Growth10x YoY+900%2026年03月
Developers1M+2026年03月
Enterprise Customers27 deals > $1M2026年03月

Competitive narrative

Differentiators

**研究驱动型公司**:核心团队创造了 FlashAttention(Tri Dao,已成为 LLM 训练的行业标准)、Red Pajama(主流开源训练数据集)等基础设施级技术
**学术阵容顶尖**:4 位联合创始人中 3 位为 Stanford / ETH Zurich 的顶级 AI 学术研究者,技术深度在同类公司中无出其右
**全栈产品覆盖**:同时提供推理 API、模型微调、预训练和 GPU 集群,一站式解决 AI 基础设施需求,区别于仅提供单一服务的竞品
**开源优先策略**:支持 200+ 开源模型,用户完全拥有微调后模型、无供应商锁定,与闭源云厂商形成鲜明差异
**性能/成本优势**:ATLAS 加速器实现 4x 推理加速,Batch API 降低 50% 成本,声称性价比优于超大规模云厂商
**自有数据中心**:正从 GPU 租赁(CoreWeave / Lambda)转向自有数据中心运营(马里兰已上线、孟菲斯在建),预计显著改善毛利率

Challenges and risks

**GPU 供应链风险**:高度依赖 NVIDIA 芯片供应,全球 GPU 短缺可能限制服务扩展和数据中心建设
**超大规模云价格战**:AWS 已将 H100 价格下调 44%(2025 年 6 月),传统云巨头持续压缩专业化提供商的利润空间
**定制芯片颠覆威胁**:Groq、Cerebras 等定制芯片在推理速度方面具有 10x+ 结构性优势,可能重塑推理市场格局
**客户集中度风险**:营收主要来自 AI 初创公司和 SaaS 企业,若 AI 投资热潮降温可能影响客户支付能力和留存
**自建数据中心资本密集**:从轻资产租赁模式转向重资产自有数据中心,需要大量前期资本投入,增加财务杠杆
**开源模型商品化**:随着 Llama、Mistral 等开源模型质量趋同,纯推理 API 服务面临严重的商品化和价格战压力
**市场碎片化**:超过 100 家"新云"(neocloud)提供商以 30-85% 的价格折扣竞争,市场格局尚未稳定

Market position

Together AI 在 AI 云基础设施市场中定位为专注于开源模型的全栈平台提供商。截至 2025 年 9 月,公司年化营收约 $300M,估值 $33 亿,在专业化 AI 云提供商中处于第一梯队。其标杆客户包括 Salesforce、Zoom、Zomato 等 SaaS 企业以及 ElevenLabs、Hedra 等高增长 AI 初创公司,客户覆盖面广泛。 在竞争格局中,Together AI 的独特定位介于纯 GPU 租赁商(CoreWeave、Lambda)和纯推理 API 服务商(Fireworks、DeepInfra)之间,通过提供推理+微调+训练的全栈能力形成差异化。其研究团队产出的 FlashAttention 已成为行业标准,Red Pajama 是最广泛使用的开源训练数据集之一,这种"研究-产品"飞轮效应在竞品中罕见。然而,GPU 云市场整体处于激烈竞争期,AWS/GCP/Azure 仍占据约 63% 市场份额,Together AI 需要在规模效应和技术壁垒之间找到可持续的竞争优势。