DeepSeek / 深度求索

🇨🇳

杭州深度求索人工智能基础技术研究有限公司

Growth中国, 杭州www.deepseek.com
Total funding$0
ConfidenceHigh 16Medium 12Low 2

Company info

Full name杭州深度求索人工智能基础技术研究有限公司
Founded2023年07月17日
Headquarters中国, 杭州
Websitewww.deepseek.com
Region🇨🇳 China
StageGrowth
Employees约160人(其中研发人员约139人
Report date2026-03-10

Overview

由幻方量化孵化的中国AI初创公司,专注于开发高性能、低成本的开源大语言模型(LLM),旨在降低通用人工智能(AGI)的实现成本

Industry tags

AI

Key people

NameRole
梁文锋 (Liang WenfengCEO, Founder
高华佐 (Gao HuazuoCore Researcher (MLA Architecture)
朱琪豪 (Zhu QihaoCore Researcher (GRPO Algorithm)

Core products and services

SaaS / Mobile App

DeepSeek Chat

面向消费者的AI对话应用,支持网页端、iOS和Android

High confidence · 3 sources · 2+ independent authoritative sources
API

DeepSeek API Platform

面向开发者的模型API服务平台,提供按Token计费的推理服务

High confidence · 2 sources · 2+ independent authoritative sources
Open Source

DeepSeek Open Source Models

在Hugging Face和GitHub上发布的开源大模型系列(含DeepSeek-V3、R1、Coder等),支持开发者下载、自托管和微调

High confidence · 3 sources · 2+ independent authoritative sources

Funding history

Total funding $0(完全自筹,由幻方量化内部资金支持)
DateRoundAmountValuationInvestorsConfidence
Medium confidence · Single authoritative source

Product release timeline

2026年02月(预计)Medium confidence · 2 sources · Single authoritative source
DeepSeek Open Source Models DeepSeek V4

下一代旗舰模型,预计于2026年春节后发布

2025年01月20日High confidence · 4 sources · 2+ independent authoritative sources
DeepSeek Open Source Models DeepSeek-R1

新一代推理模型,采用纯强化学习(RL)训练路线,推理性能达GPT-4o水平,以MIT许可证完全开源

2025年01月11日High confidence · 2 sources · 2+ independent authoritative sources
DeepSeek Chat v1.0

DeepSeek AI聊天应用上线App Store和Google Play,面向全球消费者开放

2025年(具体月份不详)Medium confidence · 1 sources · Single authoritative source
DeepSeek Open Source Models DeepSeek-V3.2

V3的升级版,引入DeepSeek稀疏注意力机制(DSA)和可扩展强化学习框架,进一步提升推理效率

2024年12月26日High confidence · 4 sources · 2+ independent authoritative sources
DeepSeek Open Source Models DeepSeek-V3

第三代旗舰模型,总参数671B,采用创新MoE架构和FP8混合精度训练,训练成本仅$557.6万(使用2048块GPU),多项评测超越GPT-4o

2024年05月07日High confidence · 3 sources · 2+ independent authoritative sources
DeepSeek Open Source Models DeepSeek-V2

第二代开源混合专家模型(MoE),总参数236B,推理成本降至每百万token仅¥1(约$0.14),引入Multi-head Latent Attention (MLA)架构

2023年11月29日High confidence · 3 sources · 2+ independent authoritative sources
DeepSeek Open Source Models DeepSeek LLM 67B

参数规模达670亿的通用大语言模型,含7B和67B两个版本的base及chat变体

2023年11月02日High confidence · 3 sources · 2+ independent authoritative sources
DeepSeek Open Source Models DeepSeek Coder

首个开源代码生成模型,支持多种编程语言的代码生成、调试和数据分析

Key events

2026

路透社独家报道,DeepSeek拒绝向英伟达等美国芯片厂商提供其最新AI模型;报道称DeepSeek可能试图掩盖使用美国AI芯片的痕迹,并计划对外宣称使用华为芯片进行训练

Anthropic公开指控DeepSeek、MiniMax、Moonshot三家中国公司通过约24,000个虚假账户"蒸馏"Claude模型,DeepSeek被指与Claude进行了超过150,000次对话交互以获取推理能力;OpenAI亦指控DeepSeek"搭便车"

DeepSeek出圈一周年,母公司幻方量化2025年度进账约¥50亿,但DeepSeek月活用户规模出现萎缩

2025

QuestMobile数据显示DeepSeek月活用户超1.9亿,位列MAU亿级APP用户规模增长榜首位

DeepSeek成为全球最快突破3000万DAU的应用程序,用时仅12天(ChatGPT达到同等规模耗时11个月)

The Information报道DeepSeek考虑首次外部融资,DeepSeek方面辟谣称"均为谣言";此前阿里拟$10亿认购10%股权传闻亦被阿里否认

DeepSeek登顶苹果美国App Store免费下载榜第一,超越ChatGPT;同日纳斯达克暴跌3%,英伟达市值蒸发近17%(约$5000亿)

DeepSeek应用在140个国家的App Store排名第一

2023

梁文锋创立DeepSeek,从幻方量化的AI研究部门独立运营,专注于AGI研究

Competitive landscape

Mistral (Mistral Large)

— 欧洲最具实力的AI公司,专注隐私合规和企业安全。

OpenAI (ChatGPT / GPT-4o / GPT-5)

— 行业标杆,闭源模式,在复杂推理、多模态和创造性内容生成方面持续领先。融资规模超百亿美元,拥有约1200名研究人员。DeepSeek-V3的训练成本仅为GPT-4o的约1/18($557万 vs ~$1亿)。

Anthropic (Claude 3.5 / Claude 4)

— 安全性优先的AI公司,在代码生成和长文本处理方面表现优异。2026年2月公开指控DeepSeek蒸馏其Claude模型。

Google DeepMind (Gemini 2.0 / Gemini 3)

— 多模态能力最强,深度整合Google生态系统。拥有最大规模的计算资源。

Meta (Llama 4)

— 开源阵营的主要对手,MoE架构(400B总参数),可在单机H100上部署,与DeepSeek在开源领域直接竞争。

阿里巴巴 (通义千问 Qwen)

— 中国企业级大模型市场份额第一(17.7%),Qwen3系列支持119种语言,战略性开源布局。 `🟡 1源` [cnblogs](https://www.cnblogs.com/xtkyxnx/p/19106388)

字节跳动 (豆包 Doubao)

— 中国最大的C端AI应用,MAU超1.1亿(2025年3月),依托抖音/TikTok的流量优势快速获客。

腾讯 (混元 Hunyuan / 元宝 Yuanbao)

— 深度整合微信生态,元宝DAU已超5000万(2026年2月),接入DeepSeek模型为用户提供服务。

月之暗面 Moonshot AI (Kimi)

— 长上下文处理专家(256K tokens窗口),在Agent工作流方面表现突出。

智谱AI (GLM)

— 企业级定制方案为主,MaaS ARR突破¥5亿,正筹备港股IPO。

百度 (文心一言 ERNIE)

— 深度整合百度搜索生态,在中国搜索场景有天然优势。

极致训练效率

DeepSeek-V3仅用2048块GPU、$557.6万成本完成训练,而GPT-4o使用25,000块GPU、成本约$1亿。成本差距超10倍。 `🟢 3源` [电子工程专辑](https://www.eet-china.com/mp/a379311.html) [搜狐](https://www.sohu.com/a/859063615_120263833) [Al Jazeera](https://www.aljazeera.com/economy/2025/1/28/why-chinas-ai-startup-deepseek-is-sending-shockwaves-through-global-tech)

完全开源

DeepSeek-R1以MIT许可证开源,允许商用,而OpenAI和Anthropic均为闭源商业模式

精简团队

仅约160名员工(其中139名研发),是OpenAI团队规模的约1/9

零外部融资

不受VC商业化压力,可专注长期技术研究

架构创新

Multi-head Latent Attention (MLA)和动态稀疏混合专家架构(MoE),在保持高性能的同时大幅降低推理成本

API定价

DeepSeek-V2时代推理成本每百万Token仅¥1(约$0.14),被业界称为"大模型界的拼多多"

纯RL训练路线

DeepSeek-R1证明了仅通过强化学习(无需SFT)即可实现推理能力飞跃,改变了行业训练范式

模型蒸馏争议

Anthropic和OpenAI均指控DeepSeek利用其模型输出进行蒸馏训练,可能面临法律和市场信任风险

芯片供应受限

受美国出口管制影响,DeepSeek获取高端AI芯片(如NVIDIA H100/A100)的渠道受限,据路透社报道公司可能试图掩盖使用美国芯片的痕迹

用户增长放缓

2026年1月报道显示MAU已出现萎缩趋势,面临来自豆包、元宝等国内竞品的激烈竞争

商业模式不清晰

公司至今没有明确的商业化路径和营收目标,被评论为"没有商业模式"

数据安全与合规

面临多国数据隐私审查,AI安全研究机构指出其模型存在易受越狱攻击的缺陷

内容审查限制

作为中国公司,DeepSeek模型在政治敏感话题上存在内容过滤,可能影响国际市场用户体验

人才竞争

核心团队规模小,面临国内外科技巨头的人才争夺压力(雷军曾千万年薪挖角DeepSeek研究员罗福莉)

Growth metrics

MAU>1.9亿(全球APP)2025年03月
DAU>3,000万(全球)2025年02月
Paid Users模型下载量超7,500万次(Hugging Face平台)2026年02月

Competitive narrative

Differentiators

**极致训练效率**:DeepSeek-V3仅用2048块GPU、$557.6万成本完成训练,而GPT-4o使用25,000块GPU、成本约$1亿。成本差距超10倍。 `🟢 3源` [电子工程专辑](https://www.eet-china.com/mp/a379311.html) [搜狐](https://www.sohu.com/a/859063615_120263833) [Al Jazeera](https://www.aljazeera.com/economy/2025/1/28/why-chinas-ai-startup-deepseek-is-sending-shockwaves-through-global-tech)
**完全开源**:DeepSeek-R1以MIT许可证开源,允许商用,而OpenAI和Anthropic均为闭源商业模式
**精简团队**:仅约160名员工(其中139名研发),是OpenAI团队规模的约1/9
**零外部融资**:不受VC商业化压力,可专注长期技术研究
**架构创新**:Multi-head Latent Attention (MLA)和动态稀疏混合专家架构(MoE),在保持高性能的同时大幅降低推理成本
**API定价**:DeepSeek-V2时代推理成本每百万Token仅¥1(约$0.14),被业界称为"大模型界的拼多多"
**纯RL训练路线**:DeepSeek-R1证明了仅通过强化学习(无需SFT)即可实现推理能力飞跃,改变了行业训练范式

Challenges and risks

**模型蒸馏争议**:Anthropic和OpenAI均指控DeepSeek利用其模型输出进行蒸馏训练,可能面临法律和市场信任风险
**芯片供应受限**:受美国出口管制影响,DeepSeek获取高端AI芯片(如NVIDIA H100/A100)的渠道受限,据路透社报道公司可能试图掩盖使用美国芯片的痕迹
**用户增长放缓**:2026年1月报道显示MAU已出现萎缩趋势,面临来自豆包、元宝等国内竞品的激烈竞争
**商业模式不清晰**:公司至今没有明确的商业化路径和营收目标,被评论为"没有商业模式"
**数据安全与合规**:面临多国数据隐私审查,AI安全研究机构指出其模型存在易受越狱攻击的缺陷
**内容审查限制**:作为中国公司,DeepSeek模型在政治敏感话题上存在内容过滤,可能影响国际市场用户体验
**人才竞争**:核心团队规模小,面临国内外科技巨头的人才争夺压力(雷军曾千万年薪挖角DeepSeek研究员罗福莉)

Market position

DeepSeek在全球AI竞争格局中占据独特的"高性价比开源先锋"位置。凭借DeepSeek-R1和V3模型在性能上接近甚至超越GPT-4o的表现,以及不到后者1/10的训练成本,DeepSeek在2025年初一举打破了"大力出奇迹"的行业共识,证明了算法创新可以在算力受限条件下实现突破。 在用户规模上,DeepSeek在2025年3月峰值时MAU超过1.9亿,超越了同期豆包的1.1亿MAU。但到2026年初,随着国内豆包、元宝等竞品的快速追赶,以及DeepSeek自身缺乏持续的产品运营投入,其用户规模出现回落。在开源社区影响力方面,DeepSeek模型在Hugging Face上累计下载超过7500万次,在中国模型中排名领先。在企业市场方面,DeepSeek的渗透率不及拥有云平台和企业客户基础的阿里通义千问,后者以17.7%的企业级份额位居国内第一。