DeepSeek 估值 3500 亿，到底凭什么？

作者视角：本文基于 2026 年 5 月公开融资信息与行业分析展开推断，不构成投资建议。未披露数据处已标明。

先说结论： 截至 2026 年 5 月，DeepSeek（深度求索，中国大模型公司，创始人梁文锋）投后估值超 3500 亿元人民币，买的不是当期收入，而是三件事——用开源 R1 打破美国 AI 行业的定价权锚点、在国家大基金背书下成为中国 AI 基础设施的候选建设者、以及能否建成正反馈闭环的不确定性溢价。23 天内估值从约 100 亿美元跃升至约 515 亿美元，反映的是行业定价体系相变，而非常规 PE 估值。

系统在相变

你以为一家公司值多少钱，是由它的收入决定的？错了。

说白了，这个世界的估值逻辑，比你想象的粗暴得多。

5 月初，DeepSeek 完成了公司史上第一轮融资，金额 500 亿元人民币，投后估值超过 3500 亿。然后创始人梁文锋个人出了 200 亿。

一家没有公布过年收入的公司，一家号称「不融资、不商业化、不路演」的公司，一家 C 端产品完全免费、API 定价低到离谱的公司，凭什么值 3500 亿？

更离谱的是时间。23 天前，DeepSeek 的估值还是 100 亿美元。23 天后，515 亿美元。涨了接近 5 倍。

这不是正常的商业估值。这是系统在相变。

物理学里有个概念叫相变（Phase Transition），水在 99 度的时候还是水，到了 100 度突然变成蒸汽。系统在临界点的跃迁，不是线性的渐变，而是状态的突变。

DeepSeek 这轮融资，就是中国 AI 行业的 100 度。

咱们来做个对齐。

# 定价权从来不在你自己手里

先说一个反常识的事实。

全球 AI 行业的估值逻辑，从来不是由公司自己决定的，而是由**定价权（Pricing Power）**决定的。

经济学里，定价权指的是行业里那个最有话语权的玩家，通过自己的定价行为，定义整个市场的价格区间。在 AI 行业，这个定价权一直握在美国公司手里。OpenAI 估值 8500 亿美元，Anthropic 估值 3800 亿美元，其他公司按这个锚点打折。

中国公司呢？打个折就算了。

这不是因为中国公司不行。说真的，是因为全球资本市场的估值体系，本质上是一个正反馈系统（Positive Feedback System）。控制论告诉我们，正反馈的特征是赢家通吃，领先者获得更多资源，进一步拉大差距，直到系统达到一个新的均衡或者崩溃。

美国 AI 公司先拿到了定价权，然后正反馈开始运转。更高的估值 → 更多的资金 → 更好的模型 → 更高的估值。这个循环一旦启动，后来者只能跟跑。

但 DeepSeek 做了一件事，打破了这个正反馈。

2025 年初，DeepSeek 发布了 R1 模型。完全开源，MIT 许可证。性能对标 OpenAI 的 o1，训练成本却低了一个数量级。它用 2048 块 H800 跑了不到 600 万美元，就训练出了一个和全球最顶尖模型掰手腕的东西。

600 万美元。OpenAI 训练 GPT-4 的成本估计在 1 亿美元以上。差了快 20 倍。

消息一出，英伟达单日市值蒸发近 6000 亿美元。全球科技股集体跳水。

为什么一个开源模型能让英伟达一天蒸发 6000 亿？

因为它传递了一个信号：算力的硬约束可能没有想象中那么硬。

# 创造性破坏，免费是最贵的武器

创造性破坏

说到这里，咱们要引入一个关键模型。

经济学家约瑟夫·熊彼特（Joseph Schumpeter）在 1942 年提出了创造性破坏（Creative Destruction）。他的意思是，资本主义的进步不是均匀的改良，而是通过新组合对旧组合的毁灭性替代。

DeepSeek 的开源策略，就是一次典型的创造性破坏。

传统 AI 公司的商业模式是封闭的。你用我的模型，付我的钱。模型越好，价格越高。GPT-4 的 API 价格比 GPT-3 贵，因为 OpenAI 需要回收训练成本。这就是 Scaling Law 的商业推论：更好的模型需要更多算力，更多算力需要更多钱，更多钱需要更高的价格。

DeepSeek 反过来了。它把最好的模型免费给你用。

这不是情怀。这是算账。

开源到底在干什么？用人话讲，它在把**生态建设的边际成本（Marginal Cost）**压到接近零。全球的开发者帮你优化、适配、推广，硬件厂商主动适配你的模型，云服务商抢着提供部署方案。你的生态在膨胀，但你一分钱推广费没花。

对比一下 OpenAI。GPT 的每一个新版本，都需要海量的算力投入、营销投入、生态维护投入。Scaling Law 还在发挥作用，每一代模型的训练成本都高于上一代。成本是指数级增长的。

而 DeepSeek 用开源把自己的生态成本压到了接近零。

这就是为什么 Altman 和 Amodei 急了。不是因为他们打不过，而是因为免费的东西一旦开始扩散，付费的就会变得很难卖。就像当年比尔·盖茨讨厌 Linux 一样。开源免费，没人愿意用 Windows 了。

回到刚才的问题。DeepSeek 的开源策略，不是在做慈善，而是在对整个 AI 行业的定价体系发动一次创造性破坏。你靠收 API 费赚钱，我就免费。你靠封闭生态锁用户，我就开放生态建标准。

谁更聪明？取决于你看的是短期还是长期。

# 开源的致命硬约束：你不赚钱

但这里有个问题。

开源有一个致命的硬约束。你不赚钱。

模型免费，API 定价极低，C 端产品完全免费。用户倒是爽了，但收入从哪来？

DeepSeek 从未正式披露过 ARR 数据。有行业分析说，按照它的 API 定价全额收费，理论成本利润率接近 545%。

545% 的利润率，听着很美。但那是理论值。咱们算个账，就像说一个人理论上能跑进 9 秒 5 一样，理论和现实之间隔着一整个训练场。

实际情况是，C 端免费意味着最大的流量来源不产生收入。DeepSeek 的国内月活已经到了 1.27 亿，AI 原生 APP 行业前三，但这些都是免费用户。大规模的企业级付费收入尚未形成规模覆盖。

今年 5 月，DeepSeek 又把旗舰模型 V4-Pro 永久降价 75%。价格直接压到原来的四分之一。

降价容易提价难。一旦用户习惯了你的低价，你就被锁在了「便宜」这个定位上。

这就是路径依赖（Path Dependence）。经济学家保罗·大卫（Paul David）在 1985 年研究过这个现象，QWERTY 键盘之所以成为标准，不是因为它最优，而是因为打字机时代的选择被锁定了，后来者只能跟从。哪怕 Dvorak 键盘效率更高，也无法取代它。

DeepSeek 选择了低价路径。这条路径会把它带向何方？

# 3500 亿买的不是收入，是底座的可能性

基础设施的估值逻辑

所以一家不赚钱的公司，凭什么值 3500 亿？

答案不在 DeepSeek 身上，在它背后的融资结构里。

这轮融资 500 亿，国家大基金（国家集成电路产业投资基金，中国政府主导的产业投资基金）领投。

国家大基金领投，这不是单纯的市场行为。DeepSeek 不只是一家公司，它是中国 AI 基础设施的候选建设者。

这里有个关键认知。基础设施的估值逻辑，和普通商业公司完全不同。

基础设施的经济学特征是什么？**高固定成本，低边际成本，强网络效应，自然垄断倾向。**一旦某个玩家成为标准，后来者的切换成本极高，市场会自然收敛到一两个主导者。

想想微信。微信聊天免费，但它靠支付、小程序、广告赚钱。当它成为社交基础设施之后，赚钱的方式自己找上门。微信不需要靠聊天收费，就像电网不需要靠电表赚钱，它靠的是不可替代性和规模效应。

DeepSeek 的目标，就是成为 AI 时代的微信。

这也是为什么梁文锋愿意自掏 200 亿。他不是在投资一个产品，他是在押注一个方向，AI 模型会成为像水电煤气一样的基础设施。基础设施不需要靠涨价赚钱，靠的是规模和不可替代性。

但这里有个反常识的风险，我必须说。你可能觉得基础设施一旦建成就是铁打的。其实不是。

微信从免费聊天到支付赚钱，中间花了好几年。那几年里，微信没有真正意义上的竞争对手。DeepSeek 可没有这个时间窗口。大模型的迭代速度比社交产品快得多，GPT-5、Claude 5、Gemini 2 都在路上了。

用适应性景观（Fitness Landscape）的模型来看，DeepSeek 目前站在一个局部高点上。但适应性景观不是静止的，它在持续变动。当环境变化时，今天的高点可能是明天的低谷。要到达更高的山峰，你必须先下山。而下山，意味着风险。

# 目标函数设错了，估值就是泡沫

说到科创板，这不是偶然的选择。

科创板对中国 AI 公司有一个独特的优势，它允许不赚钱的公司上市。这背后的逻辑是，用资本市场的时间来换取技术突破的空间。

寒武纪，科创板上市，前三季度营收 46 亿，同比暴增 23 倍，终于扭亏为盈。海光信息，科创板上市，一季度营收 40 亿，同比增长 68%，稳步盈利。这些公司上市的时候都不赚钱，甚至亏了很多年。但市场给了它们极高的估值，因为它们代表的是中国半导体和 AI 的国产替代逻辑。

但我必须提醒你，这条路上有前车之鉴。

AI 四小龙，商汤、旷视、云从、依图，当年也是估值几百亿的 AI 明星，也是不赚钱就上市，也是被寄予厚望。结果呢？上市后市值大幅缩水，盈利遥遥无期，赚的是辛苦钱。

为什么 AI 四小龙的估值站不住？

说白了，因为它们的目标函数设错了。

四小龙做的是非标的定制化项目——安防、智慧城市。这个市场的特征是：项目制、回款慢、利润薄、规模天花板低。你在做一个线性增长的业务，却给了它指数增长的估值。这中间的差距，就是泡沫。

大模型不一样。大模型做的是标准化产品，是智能世界的底座，通用性强，拥有平台级的想象空间。Kimi 的 K2.5 模型发布后，付费订阅与 API 调用激增，收入在一个月内暴增 1 亿美元。这就是大模型商业化的爆发力，四小龙从来没有过这种曲线。

但爆发力不等于确定性。

DeepSeek 的低价策略，到底是护城河还是牢笼？

低价帮你获取用户，但低价也锁死了你的提价空间。微信的免费聊天把用户锁住了，然后靠支付、小程序、广告赚钱。百度搜索也是免费的，但从来没有建立过同样的生态壁垒。

差别在哪？咱们来算笔账。

微信创造了一个正反馈闭环（Positive Feedback Loop）。用户越多 → 开发者越多 → 小程序越多 → 用户更离不开。这个闭环一旦启动，它就自动加强。

百度搜索没有这个闭环。用户用百度搜索信息，搜完就走。搜索行为本身不产生网络效应。

DeepSeek 能不能建成正反馈闭环，才是 3500 亿估值最终能否站住的核心问题。

# 梁文锋：从封闭系统跳到开放系统的人

从封闭到开放

回到梁文锋这个人。

他不是典型的 AI 创业者。没有 BAT 的履历，没有斯坦福的博士，没有在硅谷混过。他是广东湛江吴川人，父母都是小学语文老师。初中就把高中数学学完了，开始看大学数学。2002 年去了浙江大学读电子信息工程，后来又读了信息与通信工程的硕士，做机器视觉研究。硕士论文写的是基于低成本 PTZ 摄像机的目标跟踪算法。

低成本，高效率。从他做学术的时候，这个基因就在了。

2008 年，全球金融危机，23 岁的梁文锋在浙大读研，同时开始搞量化交易。用机器学习技术探索全自动量化交易，积累市场行情数据和宏观经济数据。2015 年创立幻方量化，到 2021 年管理规模突破千亿，成为中国最大的量化私募之一。

一个人从 23 岁开始用 AI 赚钱，到 38 岁管理千亿资金，然后他决定去做大模型。

这不是跨界，是升维。

量化交易和大模型，底层逻辑是一样的——算法 + 数据 + 算力，产生超额回报。只不过一个在金融领域的封闭系统里做优化，一个在通用智能的开放系统里做探索。

从封闭系统跳到开放系统，这个选择本身就很梁文锋。量化交易再大，也是有上限的。市场的容量是硬约束，策略会被别人抄，超额收益会衰减。但通用智能的天花板，是你想象力的天花板。说白了，他不是在换赛道，他是在换维。

# 三条行动认知

路径依赖与正反馈

那么，对普通人来说，DeepSeek 这件事到底意味着什么？

我觉得有三点值得认真想想。

第一，定价权的转移比技术的突破更重要。

DeepSeek 最大的影响不是 R1 的性能，而是它让中国 AI 行业第一次有了自己的估值锚点。在 DeepSeek 融资之前，中国公司的估值是按美国公司打折算的。3500 亿出来之后，这个定价体系开始松动了。这不是一家公司拿了多少钱的事，是整个行业的目标函数变了。

第二，基础设施的竞争，比的是谁先建成正反馈闭环。

开源帮你快速建生态，但生态不等于闭环。全球开发者在用你的模型，不代表他们离不开你的模型。真正的护城河不是用户多，而是切换成本高。如果你在 DeepSeek 上做了大量行业微调、部署了私有化方案、接入了内部工作流，你不会轻易换到另一个模型。这个切换成本，才是闭环的真正起点。

第三，路径依赖是双向的。

DeepSeek 选择了低价路径，它会被这条路径塑造成某种形态。就像拼多多，便宜是护城河，但也是牢笼。每一个战略选择都在定义你的未来，而你很难在后来的日子里改变方向。所以关键不是选对路径，而是在路径上持续创造新的正反馈。

说到底，3500 亿的估值，买的不是 DeepSeek 的收入，而是它作为中国 AI 底座的可能性。可能性不是确定性。但在这个重尾分布的世界里，可能性的溢价，有时候比确定性更高。

梁文锋的 200 亿，赌的就是这个。

这真是一个英雄辈出，人人如龙的时代。
这个时代最值钱的东西，不是钱，是巨变发生的时候，你还在牌桌上。

以上，既然看到这里了，如果觉得不错，随手点个赞、在看、转发三连吧，如果想第一时间收到推送，也可以给我个星标 ⭐ ～

谢谢你看我的文章，我们，下次再见。

# 常见问题

DeepSeek 3500 亿估值是怎么来的？

2026 年 5 月初，DeepSeek 完成首轮融资约 500 亿元人民币，投后估值超过 3500 亿元。此前约 23 天内，市场对其估值从约 100 亿美元升至约 515 亿美元。该数字反映资本对中国 AI 基础设施候选地位与定价权转移的预期，而非基于已披露收入的 PE 估值。

DeepSeek 公布过年收入或 ARR 吗？

没有。DeepSeek 从未正式披露 ARR 或年收入。C 端产品免费、API 定价极低，企业级付费收入尚未形成规模覆盖；行业分析中的利润率数字多为理论推算。

为什么梁文锋个人出资 200 亿？

融资结构中创始人跟投，通常被解读为对长期方向的信心信号。结合本文分析，梁文锋押注的是 AI 模型成为水电煤气级基础设施，而非短期产品收入。

DeepSeek 低价策略是护城河还是陷阱？

两者兼有，取决于能否建成正反馈闭环。低价快速获客、压低生态边际成本，但也形成路径依赖，锁死提价空间。微信靠免费社交换支付与小程序闭环；百度搜索免费却无同等网络效应——DeepSeek 落在哪一侧，决定 3500 亿能否站住。

DeepSeek 和 AI 四小龙有什么本质区别？

四小龙做非标项目制（安防、智慧城市），线性增长配指数估值，上市后估值大幅缩水。DeepSeek 走标准化通用大模型路线，具备平台级想象空间，但商业化确定性仍待验证；爆发力可参考 Kimi 等同类产品的订阅与 API 曲线，不等于 DeepSeek 已复制该路径。

API 中转站正在消失：AI 算力平台如何接管 Token 入口你以为 AI 只是让程序员写代码更快？那是最低级的叙事

飞行的蜗牛

Choose mode