DeepSeek / 深度求索
🇨🇳杭州深度求索人工智能基础技术研究有限公司
Company info
Overview
由幻方量化孵化的中国AI初创公司,专注于开发高性能、低成本的开源大语言模型(LLM),旨在降低通用人工智能(AGI)的实现成本
Industry tags
Key people
Core products and services
DeepSeek Chat
面向消费者的AI对话应用,支持网页端、iOS和Android
DeepSeek API Platform
面向开发者的模型API服务平台,提供按Token计费的推理服务
DeepSeek Open Source Models
在Hugging Face和GitHub上发布的开源大模型系列(含DeepSeek-V3、R1、Coder等),支持开发者下载、自托管和微调
Funding history
| Date | Round | Amount | Valuation | Investors | Confidence |
|---|---|---|---|---|---|
| — | — | — | — | — | Medium confidence · Single authoritative source |
Product release timeline
下一代旗舰模型,预计于2026年春节后发布
新一代推理模型,采用纯强化学习(RL)训练路线,推理性能达GPT-4o水平,以MIT许可证完全开源
DeepSeek AI聊天应用上线App Store和Google Play,面向全球消费者开放
V3的升级版,引入DeepSeek稀疏注意力机制(DSA)和可扩展强化学习框架,进一步提升推理效率
第三代旗舰模型,总参数671B,采用创新MoE架构和FP8混合精度训练,训练成本仅$557.6万(使用2048块GPU),多项评测超越GPT-4o
第二代开源混合专家模型(MoE),总参数236B,推理成本降至每百万token仅¥1(约$0.14),引入Multi-head Latent Attention (MLA)架构
参数规模达670亿的通用大语言模型,含7B和67B两个版本的base及chat变体
首个开源代码生成模型,支持多种编程语言的代码生成、调试和数据分析
Key events
路透社独家报道,DeepSeek拒绝向英伟达等美国芯片厂商提供其最新AI模型;报道称DeepSeek可能试图掩盖使用美国AI芯片的痕迹,并计划对外宣称使用华为芯片进行训练
Anthropic公开指控DeepSeek、MiniMax、Moonshot三家中国公司通过约24,000个虚假账户"蒸馏"Claude模型,DeepSeek被指与Claude进行了超过150,000次对话交互以获取推理能力;OpenAI亦指控DeepSeek"搭便车"
DeepSeek出圈一周年,母公司幻方量化2025年度进账约¥50亿,但DeepSeek月活用户规模出现萎缩
QuestMobile数据显示DeepSeek月活用户超1.9亿,位列MAU亿级APP用户规模增长榜首位
DeepSeek成为全球最快突破3000万DAU的应用程序,用时仅12天(ChatGPT达到同等规模耗时11个月)
The Information报道DeepSeek考虑首次外部融资,DeepSeek方面辟谣称"均为谣言";此前阿里拟$10亿认购10%股权传闻亦被阿里否认
DeepSeek登顶苹果美国App Store免费下载榜第一,超越ChatGPT;同日纳斯达克暴跌3%,英伟达市值蒸发近17%(约$5000亿)
DeepSeek应用在140个国家的App Store排名第一
梁文锋创立DeepSeek,从幻方量化的AI研究部门独立运营,专注于AGI研究
Competitive landscape
Mistral (Mistral Large)
— 欧洲最具实力的AI公司,专注隐私合规和企业安全。
OpenAI (ChatGPT / GPT-4o / GPT-5)
— 行业标杆,闭源模式,在复杂推理、多模态和创造性内容生成方面持续领先。融资规模超百亿美元,拥有约1200名研究人员。DeepSeek-V3的训练成本仅为GPT-4o的约1/18($557万 vs ~$1亿)。
Anthropic (Claude 3.5 / Claude 4)
— 安全性优先的AI公司,在代码生成和长文本处理方面表现优异。2026年2月公开指控DeepSeek蒸馏其Claude模型。
Google DeepMind (Gemini 2.0 / Gemini 3)
— 多模态能力最强,深度整合Google生态系统。拥有最大规模的计算资源。
Meta (Llama 4)
— 开源阵营的主要对手,MoE架构(400B总参数),可在单机H100上部署,与DeepSeek在开源领域直接竞争。
阿里巴巴 (通义千问 Qwen)
— 中国企业级大模型市场份额第一(17.7%),Qwen3系列支持119种语言,战略性开源布局。 `🟡 1源` [cnblogs](https://www.cnblogs.com/xtkyxnx/p/19106388)
字节跳动 (豆包 Doubao)
— 中国最大的C端AI应用,MAU超1.1亿(2025年3月),依托抖音/TikTok的流量优势快速获客。
腾讯 (混元 Hunyuan / 元宝 Yuanbao)
— 深度整合微信生态,元宝DAU已超5000万(2026年2月),接入DeepSeek模型为用户提供服务。
月之暗面 Moonshot AI (Kimi)
— 长上下文处理专家(256K tokens窗口),在Agent工作流方面表现突出。
智谱AI (GLM)
— 企业级定制方案为主,MaaS ARR突破¥5亿,正筹备港股IPO。
百度 (文心一言 ERNIE)
— 深度整合百度搜索生态,在中国搜索场景有天然优势。
极致训练效率
DeepSeek-V3仅用2048块GPU、$557.6万成本完成训练,而GPT-4o使用25,000块GPU、成本约$1亿。成本差距超10倍。 `🟢 3源` [电子工程专辑](https://www.eet-china.com/mp/a379311.html) [搜狐](https://www.sohu.com/a/859063615_120263833) [Al Jazeera](https://www.aljazeera.com/economy/2025/1/28/why-chinas-ai-startup-deepseek-is-sending-shockwaves-through-global-tech)
完全开源
DeepSeek-R1以MIT许可证开源,允许商用,而OpenAI和Anthropic均为闭源商业模式
精简团队
仅约160名员工(其中139名研发),是OpenAI团队规模的约1/9
零外部融资
不受VC商业化压力,可专注长期技术研究
架构创新
Multi-head Latent Attention (MLA)和动态稀疏混合专家架构(MoE),在保持高性能的同时大幅降低推理成本
API定价
DeepSeek-V2时代推理成本每百万Token仅¥1(约$0.14),被业界称为"大模型界的拼多多"
纯RL训练路线
DeepSeek-R1证明了仅通过强化学习(无需SFT)即可实现推理能力飞跃,改变了行业训练范式
模型蒸馏争议
Anthropic和OpenAI均指控DeepSeek利用其模型输出进行蒸馏训练,可能面临法律和市场信任风险
芯片供应受限
受美国出口管制影响,DeepSeek获取高端AI芯片(如NVIDIA H100/A100)的渠道受限,据路透社报道公司可能试图掩盖使用美国芯片的痕迹
用户增长放缓
2026年1月报道显示MAU已出现萎缩趋势,面临来自豆包、元宝等国内竞品的激烈竞争
商业模式不清晰
公司至今没有明确的商业化路径和营收目标,被评论为"没有商业模式"
数据安全与合规
面临多国数据隐私审查,AI安全研究机构指出其模型存在易受越狱攻击的缺陷
内容审查限制
作为中国公司,DeepSeek模型在政治敏感话题上存在内容过滤,可能影响国际市场用户体验
人才竞争
核心团队规模小,面临国内外科技巨头的人才争夺压力(雷军曾千万年薪挖角DeepSeek研究员罗福莉)
Growth metrics
Competitive narrative
Differentiators
Challenges and risks
Market position
DeepSeek在全球AI竞争格局中占据独特的"高性价比开源先锋"位置。凭借DeepSeek-R1和V3模型在性能上接近甚至超越GPT-4o的表现,以及不到后者1/10的训练成本,DeepSeek在2025年初一举打破了"大力出奇迹"的行业共识,证明了算法创新可以在算力受限条件下实现突破。 在用户规模上,DeepSeek在2025年3月峰值时MAU超过1.9亿,超越了同期豆包的1.1亿MAU。但到2026年初,随着国内豆包、元宝等竞品的快速追赶,以及DeepSeek自身缺乏持续的产品运营投入,其用户规模出现回落。在开源社区影响力方面,DeepSeek模型在Hugging Face上累计下载超过7500万次,在中国模型中排名领先。在企业市场方面,DeepSeek的渗透率不及拥有云平台和企业客户基础的阿里通义千问,后者以17.7%的企业级份额位居国内第一。