DeepSeek / 深度求索

🇨🇳

杭州深度求索人工智能基础技术研究有限公司

Growth中国, 杭州www.deepseek.com

Total funding$0

ConfidenceHigh 16Medium 12Low 2

Company info

Full name杭州深度求索人工智能基础技术研究有限公司

Founded2023年07月17日

Headquarters中国, 杭州

Websitewww.deepseek.com

Region🇨🇳 China

StageGrowth

Employees约160人（其中研发人员约139人

Report date2026-03-10

Overview

由幻方量化孵化的中国AI初创公司，专注于开发高性能、低成本的开源大语言模型（LLM），旨在降低通用人工智能（AGI）的实现成本

Industry tags

Key people

NameRole

梁文锋 (Liang WenfengCEO, Founder

高华佐 (Gao HuazuoCore Researcher (MLA Architecture)

朱琪豪 (Zhu QihaoCore Researcher (GRPO Algorithm)

Core products and services

SaaS / Mobile App

DeepSeek Chat

面向消费者的AI对话应用，支持网页端、iOS和Android

High confidence · 3 sources · 2+ independent authoritative sources

API

DeepSeek API Platform

面向开发者的模型API服务平台，提供按Token计费的推理服务

High confidence · 2 sources · 2+ independent authoritative sources

Open Source

DeepSeek Open Source Models

在Hugging Face和GitHub上发布的开源大模型系列（含DeepSeek-V3、R1、Coder等），支持开发者下载、自托管和微调

High confidence · 3 sources · 2+ independent authoritative sources

Funding history

Total funding $0（完全自筹，由幻方量化内部资金支持）

Date	Round	Amount	Valuation	Investors	Confidence
—	—	—	—	—	Medium confidence · Single authoritative source

Product release timeline

2026年02月（预计）Medium confidence · 2 sources · Single authoritative source

DeepSeek Open Source Models DeepSeek V4

下一代旗舰模型，预计于2026年春节后发布

2025年01月20日High confidence · 4 sources · 2+ independent authoritative sources

DeepSeek Open Source Models DeepSeek-R1

新一代推理模型，采用纯强化学习（RL）训练路线，推理性能达GPT-4o水平，以MIT许可证完全开源

2025年01月11日High confidence · 2 sources · 2+ independent authoritative sources

DeepSeek Chat v1.0

DeepSeek AI聊天应用上线App Store和Google Play，面向全球消费者开放

2025年（具体月份不详）Medium confidence · 1 sources · Single authoritative source

DeepSeek Open Source Models DeepSeek-V3.2

V3的升级版，引入DeepSeek稀疏注意力机制（DSA）和可扩展强化学习框架，进一步提升推理效率

2024年12月26日High confidence · 4 sources · 2+ independent authoritative sources

DeepSeek Open Source Models DeepSeek-V3

第三代旗舰模型，总参数671B，采用创新MoE架构和FP8混合精度训练，训练成本仅$557.6万（使用2048块GPU），多项评测超越GPT-4o

2024年05月07日High confidence · 3 sources · 2+ independent authoritative sources

DeepSeek Open Source Models DeepSeek-V2

第二代开源混合专家模型（MoE），总参数236B，推理成本降至每百万token仅¥1（约$0.14），引入Multi-head Latent Attention (MLA)架构

2023年11月29日High confidence · 3 sources · 2+ independent authoritative sources

DeepSeek Open Source Models DeepSeek LLM 67B

参数规模达670亿的通用大语言模型，含7B和67B两个版本的base及chat变体

2023年11月02日High confidence · 3 sources · 2+ independent authoritative sources

DeepSeek Open Source Models DeepSeek Coder

首个开源代码生成模型，支持多种编程语言的代码生成、调试和数据分析

Key events

2026

路透社独家报道，DeepSeek拒绝向英伟达等美国芯片厂商提供其最新AI模型；报道称DeepSeek可能试图掩盖使用美国AI芯片的痕迹，并计划对外宣称使用华为芯片进行训练

Anthropic公开指控DeepSeek、MiniMax、Moonshot三家中国公司通过约24,000个虚假账户"蒸馏"Claude模型，DeepSeek被指与Claude进行了超过150,000次对话交互以获取推理能力；OpenAI亦指控DeepSeek"搭便车"

DeepSeek出圈一周年，母公司幻方量化2025年度进账约¥50亿，但DeepSeek月活用户规模出现萎缩

2025

QuestMobile数据显示DeepSeek月活用户超1.9亿，位列MAU亿级APP用户规模增长榜首位

DeepSeek成为全球最快突破3000万DAU的应用程序，用时仅12天（ChatGPT达到同等规模耗时11个月）

The Information报道DeepSeek考虑首次外部融资，DeepSeek方面辟谣称"均为谣言"；此前阿里拟$10亿认购10%股权传闻亦被阿里否认

DeepSeek登顶苹果美国App Store免费下载榜第一，超越ChatGPT；同日纳斯达克暴跌3%，英伟达市值蒸发近17%（约$5000亿）

DeepSeek应用在140个国家的App Store排名第一

2023

梁文锋创立DeepSeek，从幻方量化的AI研究部门独立运营，专注于AGI研究

Competitive landscape

Mistral (Mistral Large)

— 欧洲最具实力的AI公司，专注隐私合规和企业安全。

OpenAI (ChatGPT / GPT-4o / GPT-5)

— 行业标杆，闭源模式，在复杂推理、多模态和创造性内容生成方面持续领先。融资规模超百亿美元，拥有约1200名研究人员。DeepSeek-V3的训练成本仅为GPT-4o的约1/18（$557万 vs ~$1亿）。

Anthropic (Claude 3.5 / Claude 4)

— 安全性优先的AI公司，在代码生成和长文本处理方面表现优异。2026年2月公开指控DeepSeek蒸馏其Claude模型。

Google DeepMind (Gemini 2.0 / Gemini 3)

— 多模态能力最强，深度整合Google生态系统。拥有最大规模的计算资源。

Meta (Llama 4)

— 开源阵营的主要对手，MoE架构（400B总参数），可在单机H100上部署，与DeepSeek在开源领域直接竞争。

阿里巴巴 (通义千问 Qwen)

— 中国企业级大模型市场份额第一（17.7%），Qwen3系列支持119种语言，战略性开源布局。 `🟡 1源` [cnblogs](https://www.cnblogs.com/xtkyxnx/p/19106388)

字节跳动 (豆包 Doubao)

— 中国最大的C端AI应用，MAU超1.1亿（2025年3月），依托抖音/TikTok的流量优势快速获客。

腾讯 (混元 Hunyuan / 元宝 Yuanbao)

— 深度整合微信生态，元宝DAU已超5000万（2026年2月），接入DeepSeek模型为用户提供服务。

月之暗面 Moonshot AI (Kimi)

— 长上下文处理专家（256K tokens窗口），在Agent工作流方面表现突出。

智谱AI (GLM)

— 企业级定制方案为主，MaaS ARR突破¥5亿，正筹备港股IPO。

百度 (文心一言 ERNIE)

— 深度整合百度搜索生态，在中国搜索场景有天然优势。

极致训练效率

DeepSeek-V3仅用2048块GPU、$557.6万成本完成训练，而GPT-4o使用25,000块GPU、成本约$1亿。成本差距超10倍。 `🟢 3源` [电子工程专辑](https://www.eet-china.com/mp/a379311.html) [搜狐](https://www.sohu.com/a/859063615_120263833) [Al Jazeera](https://www.aljazeera.com/economy/2025/1/28/why-chinas-ai-startup-deepseek-is-sending-shockwaves-through-global-tech)

完全开源

DeepSeek-R1以MIT许可证开源，允许商用，而OpenAI和Anthropic均为闭源商业模式

精简团队

仅约160名员工（其中139名研发），是OpenAI团队规模的约1/9

零外部融资

不受VC商业化压力，可专注长期技术研究

架构创新

Multi-head Latent Attention (MLA)和动态稀疏混合专家架构（MoE），在保持高性能的同时大幅降低推理成本

API定价

DeepSeek-V2时代推理成本每百万Token仅¥1（约$0.14），被业界称为"大模型界的拼多多"

纯RL训练路线

DeepSeek-R1证明了仅通过强化学习（无需SFT）即可实现推理能力飞跃，改变了行业训练范式

模型蒸馏争议

Anthropic和OpenAI均指控DeepSeek利用其模型输出进行蒸馏训练，可能面临法律和市场信任风险

芯片供应受限

受美国出口管制影响，DeepSeek获取高端AI芯片（如NVIDIA H100/A100）的渠道受限，据路透社报道公司可能试图掩盖使用美国芯片的痕迹

用户增长放缓

2026年1月报道显示MAU已出现萎缩趋势，面临来自豆包、元宝等国内竞品的激烈竞争

商业模式不清晰

公司至今没有明确的商业化路径和营收目标，被评论为"没有商业模式"

数据安全与合规

面临多国数据隐私审查，AI安全研究机构指出其模型存在易受越狱攻击的缺陷

内容审查限制

作为中国公司，DeepSeek模型在政治敏感话题上存在内容过滤，可能影响国际市场用户体验

人才竞争

核心团队规模小，面临国内外科技巨头的人才争夺压力（雷军曾千万年薪挖角DeepSeek研究员罗福莉）

Growth metrics

MAU>1.9亿（全球APP）—2025年03月

DAU>3,000万（全球）—2025年02月

Paid Users模型下载量超7,500万次（Hugging Face平台）—2026年02月

Competitive narrative

Differentiators

**极致训练效率**：DeepSeek-V3仅用2048块GPU、$557.6万成本完成训练，而GPT-4o使用25,000块GPU、成本约$1亿。成本差距超10倍。 `🟢 3源` [电子工程专辑](https://www.eet-china.com/mp/a379311.html) [搜狐](https://www.sohu.com/a/859063615_120263833) [Al Jazeera](https://www.aljazeera.com/economy/2025/1/28/why-chinas-ai-startup-deepseek-is-sending-shockwaves-through-global-tech)

**完全开源**：DeepSeek-R1以MIT许可证开源，允许商用，而OpenAI和Anthropic均为闭源商业模式

**精简团队**：仅约160名员工（其中139名研发），是OpenAI团队规模的约1/9

**零外部融资**：不受VC商业化压力，可专注长期技术研究

**架构创新**：Multi-head Latent Attention (MLA)和动态稀疏混合专家架构（MoE），在保持高性能的同时大幅降低推理成本

**API定价**：DeepSeek-V2时代推理成本每百万Token仅¥1（约$0.14），被业界称为"大模型界的拼多多"

**纯RL训练路线**：DeepSeek-R1证明了仅通过强化学习（无需SFT）即可实现推理能力飞跃，改变了行业训练范式

Challenges and risks

**模型蒸馏争议**：Anthropic和OpenAI均指控DeepSeek利用其模型输出进行蒸馏训练，可能面临法律和市场信任风险

**芯片供应受限**：受美国出口管制影响，DeepSeek获取高端AI芯片（如NVIDIA H100/A100）的渠道受限，据路透社报道公司可能试图掩盖使用美国芯片的痕迹

**用户增长放缓**：2026年1月报道显示MAU已出现萎缩趋势，面临来自豆包、元宝等国内竞品的激烈竞争

**商业模式不清晰**：公司至今没有明确的商业化路径和营收目标，被评论为"没有商业模式"

**数据安全与合规**：面临多国数据隐私审查，AI安全研究机构指出其模型存在易受越狱攻击的缺陷

**内容审查限制**：作为中国公司，DeepSeek模型在政治敏感话题上存在内容过滤，可能影响国际市场用户体验

**人才竞争**：核心团队规模小，面临国内外科技巨头的人才争夺压力（雷军曾千万年薪挖角DeepSeek研究员罗福莉）

Market position

DeepSeek在全球AI竞争格局中占据独特的"高性价比开源先锋"位置。凭借DeepSeek-R1和V3模型在性能上接近甚至超越GPT-4o的表现，以及不到后者1/10的训练成本，DeepSeek在2025年初一举打破了"大力出奇迹"的行业共识，证明了算法创新可以在算力受限条件下实现突破。在用户规模上，DeepSeek在2025年3月峰值时MAU超过1.9亿，超越了同期豆包的1.1亿MAU。但到2026年初，随着国内豆包、元宝等竞品的快速追赶，以及DeepSeek自身缺乏持续的产品运营投入，其用户规模出现回落。在开源社区影响力方面，DeepSeek模型在Hugging Face上累计下载超过7500万次，在中国模型中排名领先。在企业市场方面，DeepSeek的渗透率不及拥有云平台和企业客户基础的阿里通义千问，后者以17.7%的企业级份额位居国内第一。

Sources

Wikipedia — en.wikipedia.orgHigh confidence · 2+ independent authoritative sources 电子工程专辑 — eet-china.comHigh confidence · 2+ independent authoritative sources 搜狐 — sohu.comHigh confidence · 2+ independent authoritative sources 阿里云 — developer.aliyun.comHigh confidence · 2+ independent authoritative sources CNBC — cnbc.comHigh confidence · 2+ independent authoritative sources