Stability AI
🇬🇧Stability AI Ltd
Company info
Overview
开源多模态生成式AI公司,以Stable Diffusion文生图模型闻名,提供图像、视频、音频和3D领域的企业级生成式AI工具
Industry tags
Key people
Core products and services
Stable Diffusion
文生图基础模型,支持多分辨率图像生成与编辑,下载量超3.5亿次
- 支持文生图(text-to-image)、图生图(image-to-image)、图像修复(inpainting)
- 模型参数从8亿到80亿,适配消费级硬件到企业级部署
- 开源社区驱动,支持LoRA微调、ControlNet精细控制
- 最新版SD 3.5采用Multimodal Diffusion Transformer (MMDiT)架构,提升文字理解和排版准确性
- 在人类评测中,排版和提示词遵循度超越DALL·E 3和Midjourney v6
- 开放权重,通过Hugging Face和GitHub免费分发(Community License)
Stable Video Diffusion
基于图像生成视频的基础模型,支持多帧率和多视角合成
Stable Audio
AI音频生成工具,支持音乐和音效创作,曾入选TIME最佳发明
ClipDrop
AI驱动的图像捕捉与增强工具,提供背景去除、图像升级等功能
Stable 3D (TripoSR / SPAR3D / Stable Fast 3D
从单张图像生成3D对象的系列模型,支持实时编辑
Funding history
| Date | Round | Amount | Valuation | Investors | Confidence |
|---|---|---|---|---|---|
| 2022年08月 | Seed | $101M | $1B (post-money) | Coatue Management Lead, Lightspeed Venture Partners Lead, O'Shaughnessy Ventures | High confidence · 3 sources · 2+ independent authoritative sources |
| 2024年06月 | Strategic Investment | 未披露 | 未披露(可能低于$1B) | Greycroft, Coatue Management, Sound Ventures, Lightspeed Venture Partners, O'Shaughnessy Ventures, Sean Parker, Eric Schmidt, Prem Akkaraju, Robert Nelsen | High confidence · 3 sources · 2+ independent authoritative sources |
| 2025年03月 | Corporate Round | 未披露 | 未披露 | WPP | High confidence · 2 sources · 2+ independent authoritative sources |
Product release timeline
Stable Point Aware 3D发布,支持单图实时3D对象编辑和完整结构生成
发布Large/Large Turbo/Medium三个变体,社区许可证免费开放
开放发布SD3 Medium(20亿参数),适配消费级硬件
发布早期预览,引入MMDiT架构,显著提升排版和多主体生成能力
首个视频生成基础模型,支持图生视频(14/25帧),研究预览版
首次发布AI音频生成工具,入选TIME最佳发明2023
大幅提升图像质量和细节表现,成为社区主力模型
新架构升级,支持更高分辨率(768x768),改进图像质量
首次公开发布,开源文生图模型,掀起生成式AI革命
Key events
英国高等法院驳回Getty Images的核心版权侵权主张,仅认定有限的商标责任——AI训练版权领域里程碑判决
与华纳音乐集团(WMG)合作,开发下一代负责任AI音乐创作工具
与环球音乐集团(UMG)达成战略联盟,共同开发负责任的AI音乐创作工具
WPP宣布投资Stability AI并建立战略合作伙伴关系,将生成式AI集成到广告创意工作流
CEO Akkaraju宣布公司业务实现三位数增长,资产负债表清洁,无债务
Prem Akkaraju被任命为CEO,Sean Parker担任执行董事长,James Cameron加入董事会
面临现金危机,与至少一名潜在买家讨论出售事宜
公司裁员约10%,主要涉及运营岗位,由联合临时CEO宣布
创始人兼CEO Emad Mostaque辞职,COO Shan Shan Wong与CTO Christian Laforte担任联合临时CEO
Getty Images在美国特拉华州地方法院对Stability AI提起诉讼,主张版权和商标侵权
Getty Images在英国高等法院起诉Stability AI,指控其未经许可使用受版权保护的图片训练Stable Diffusion模型
收购Init ML及其旗下产品ClipDrop,获取AI图像编辑工具能力
Competitive landscape
Midjourney (Midjourney v7)
— 图像生成领域的美学标杆,以艺术性和照片级真实感著称,采用Discord社区驱动的订阅模式,定价$10-60/月,在创意设计和概念艺术领域拥有强大用户忠诚度
OpenAI (DALL·E 3)
— 与ChatGPT深度集成,用户体验最友好,语义理解和提示词遵循度优秀,背靠$110B+融资和数亿用户生态系统,在大众市场覆盖面远超竞争对手
Ideogram (Ideogram 2.0/3.0)
— 在图像内文字渲染方面领先行业,特别适合品牌资产、Logo和排版设计,提供慷慨的免费使用额度
Adobe (Firefly)
— 企业级商业安全保障,与Creative Cloud深度集成,提供版权赔偿承诺,是企业和营销团队的首选,但创意灵活性相对受限
Black Forest Labs (Flux)
— 前Stability AI研究人员创建,在照片级真实感方面表现突出,代表开源模型的新一代竞争力量
Leonardo AI
— 以高性价比著称的AI图像平台,提供丰富的免费额度和直观的Web界面,在预算敏感的创作者群体中占有一席之地
Runway (Gen-3)
— AI视频生成领域的领先者,已获$240M+融资,在文生视频和视频编辑方面保持技术领先
Pika Labs
— AI视频生成新锐,以用户友好的界面和快速的产品迭代吸引创作者群体
Suno / Udio
— AI音乐生成领域的直接竞争对手,在消费级音乐创作市场与Stable Audio正面竞争
开源战略
Stability AI是唯一一家将基础模型权重完全开放的主要图像生成AI公司,Stable Diffusion社区许可证允许免费商业使用
多模态覆盖
同时覆盖图像、视频、音频、3D四个模态,在生成式AI公司中覆盖面最广
生态系统规模
Stable Diffusion累计下载量超3.5亿,拥有全球最大的开源图像生成社区,衍生出数千个微调模型和工具
消费级硬件适配
SD3.5 Medium(25亿参数)可在消费级GPU上运行,降低了使用门槛
企业级转型
在新CEO领导下,从社区导向向企业API和许可服务转型,与WPP、UMG、WMG等建立战略合作
营收规模有限
年收入约$36.9M,与OpenAI($12.7B ARR)和Midjourney(估计$200M+ ARR)相比差距悬殊
创始人争议遗留问题
前CEO Emad Mostaque的管理混乱导致投资者信任受损、核心研究人员流失(部分创立了竞争对手Flux/Black Forest Labs)
持续的法律风险
虽然英国Getty案获胜,但美国案件仍在审理,版权诉讼风险持续
开源变现困境
核心产品开源免费使用,将开源影响力转化为付费收入仍是核心挑战
人才流失
多名关键研究人员离职,包括Stable Diffusion核心研究者Robin Rombach等人
竞争加剧
闭源模型(Midjourney、DALL·E)在图像质量上持续缩小差距,开源新锐(Flux)在技术上形成新威胁
Growth metrics
Competitive narrative
Differentiators
Challenges and risks
Market position
Stability AI是生成式AI领域的先驱公司之一,以2022年8月开源发布Stable Diffusion为起点,引爆了整个AI图像生成行业。Stable Diffusion凭借超过3.5亿次下载量成为全球使用最广泛的图像生成模型,在开源生态系统中占据无可争议的领导地位。 然而,从商业角度看,Stability AI面临"叫好不叫座"的困境。公司年收入约$36.9M,与同行相比规模较小。在经历了2023-2024年的管理危机和财务困难后,新管理层在2024年下半年成功稳定了局面,实现了三位数业务增长并清除了全部债务。通过与WPP、UMG、WMG等大型企业的战略合作,Stability AI正在加速从开源社区模式向企业级商业服务转型。