DeepSeek 估值 3500 亿,到底凭什么?
作者视角:本文基于 2026 年 5 月公开融资信息与行业分析展开推断,不构成投资建议。未披露数据处已标明。
先说结论: 截至 2026 年 5 月,DeepSeek(深度求索,中国大模型公司,创始人梁文锋)投后估值超 3500 亿元人民币,买的不是当期收入,而是三件事——用开源 R1 打破美国 AI 行业的定价权锚点、在国家大基金背书下成为中国 AI 基础设施的候选建设者、以及能否建成正反馈闭环的不确定性溢价。23 天内估值从约 100 亿美元跃升至约 515 亿美元,反映的是行业定价体系相变,而非常规 PE 估值。

你以为一家公司值多少钱,是由它的收入决定的?错了。
说白了,这个世界的估值逻辑,比你想象的粗暴得多。
5 月初,DeepSeek 完成了公司史上第一轮融资,金额 500 亿元人民币,投后估值超过 3500 亿。然后创始人梁文锋个人出了 200 亿。
一家没有公布过年收入的公司,一家号称「不融资、不商业化、不路演」的公司,一家 C 端产品完全免费、API 定价低到离谱的公司,凭什么值 3500 亿?
更离谱的是时间。23 天前,DeepSeek 的估值还是 100 亿美元。23 天后,515 亿美元。涨了接近 5 倍。
这不是正常的商业估值。这是系统在相变。
物理学里有个概念叫相变(Phase Transition),水在 99 度的时候还是水,到了 100 度突然变成蒸汽。系统在临界点的跃迁,不是线性的渐变,而是状态的突变。
DeepSeek 这轮融资,就是中国 AI 行业的 100 度。
咱们来做个对齐。
# 定价权从来不在你自己手里
先说一个反常识的事实。
全球 AI 行业的估值逻辑,从来不是由公司自己决定的,而是由**定价权(Pricing Power)**决定的。
经济学里,定价权指的是行业里那个最有话语权的玩家,通过自己的定价行为,定义整个市场的价格区间。在 AI 行业,这个定价权一直握在美国公司手里。OpenAI 估值 8500 亿美元,Anthropic 估值 3800 亿美元,其他公司按这个锚点打折。
中国公司呢?打个折就算了。
这不是因为中国公司不行。说真的,是因为全球资本市场的估值体系,本质上是一个正反馈系统(Positive Feedback System)。控制论告诉我们,正反馈的特征是赢家通吃,领先者获得更多资源,进一步拉大差距,直到系统达到一个新的均衡或者崩溃。
美国 AI 公司先拿到了定价权,然后正反馈开始运转。更高的估值 → 更多的资金 → 更好的模型 → 更高的估值。这个循环一旦启动,后来者只能跟跑。
但 DeepSeek 做了一件事,打破了这个正反馈。
2025 年初,DeepSeek 发布了 R1 模型。完全开源,MIT 许可证。性能对标 OpenAI 的 o1,训练成本却低了一个数量级。它用 2048 块 H800 跑了不到 600 万美元,就训练出了一个和全球最顶尖模型掰手腕的东西。
600 万美元。OpenAI 训练 GPT-4 的成本估计在 1 亿美元以上。差了快 20 倍。
消息一出,英伟达单日市值蒸发近 6000 亿美元。全球科技股集体跳水。
为什么一个开源模型能让英伟达一天蒸发 6000 亿?
因为它传递了一个信号:算力的硬约束可能没有想象中那么硬。
# 创造性破坏,免费是最贵的武器

说到这里,咱们要引入一个关键模型。
经济学家约瑟夫·熊彼特(Joseph Schumpeter)在 1942 年提出了创造性破坏(Creative Destruction)。他的意思是,资本主义的进步不是均匀的改良,而是通过新组合对旧组合的毁灭性替代。
DeepSeek 的开源策略,就是一次典型的创造性破坏。
传统 AI 公司的商业模式是封闭的。你用我的模型,付我的钱。模型越好,价格越高。GPT-4 的 API 价格比 GPT-3 贵,因为 OpenAI 需要回收训练成本。这就是 Scaling Law 的商业推论:更好的模型需要更多算力,更多算力需要更多钱,更多钱需要更高的价格。
DeepSeek 反过来了。它把最好的模型免费给你用。
这不是情怀。这是算账。
开源到底在干什么?用人话讲,它在把**生态建设的边际成本(Marginal Cost)**压到接近零。全球的开发者帮你优化、适配、推广,硬件厂商主动适配你的模型,云服务商抢着提供部署方案。你的生态在膨胀,但你一分钱推广费没花。
对比一下 OpenAI。GPT 的每一个新版本,都需要海量的算力投入、营销投入、生态维护投入。Scaling Law 还在发挥作用,每一代模型的训练成本都高于上一代。成本是指数级增长的。
而 DeepSeek 用开源把自己的生态成本压到了接近零。
这就是为什么 Altman 和 Amodei 急了。不是因为他们打不过,而是因为免费的东西一旦开始扩散,付费的就会变得很难卖。就像当年比尔·盖茨讨厌 Linux 一样。开源免费,没人愿意用 Windows 了。
回到刚才的问题。DeepSeek 的开源策略,不是在做慈善,而是在对整个 AI 行业的定价体系发动一次创造性破坏。你靠收 API 费赚钱,我就免费。你靠封闭生态锁用户,我就开放生态建标准。
谁更聪明?取决于你看的是短期还是长期。
# 开源的致命硬约束:你不赚钱
但这里有个问题。
开源有一个致命的硬约束。你不赚钱。
模型免费,API 定价极低,C 端产品完全免费。用户倒是爽了,但收入从哪来?
DeepSeek 从未正式披露过 ARR 数据。有行业分析说,按照它的 API 定价全额收费,理论成本利润率接近 545%。
545% 的利润率,听着很美。但那是理论值。咱们算个账,就像说一个人理论上能跑进 9 秒 5 一样,理论和现实之间隔着一整个训练场。
实际情况是,C 端免费意味着最大的流量来源不产生收入。DeepSeek 的国内月活已经到了 1.27 亿,AI 原生 APP 行业前三,但这些都是免费用户。大规模的企业级付费收入尚未形成规模覆盖。
今年 5 月,DeepSeek 又把旗舰模型 V4-Pro 永久降价 75%。价格直接压到原来的四分之一。
降价容易提价难。一旦用户习惯了你的低价,你就被锁在了「便宜」这个定位上。
这就是路径依赖(Path Dependence)。经济学家保罗·大卫(Paul David)在 1985 年研究过这个现象,QWERTY 键盘之所以成为标准,不是因为它最优,而是因为打字机时代的选择被锁定了,后来者只能跟从。哪怕 Dvorak 键盘效率更高,也无法取代它。
DeepSeek 选择了低价路径。这条路径会把它带向何方?
# 3500 亿买的不是收入,是底座的可能性

所以一家不赚钱的公司,凭什么值 3500 亿?
答案不在 DeepSeek 身上,在它背后的融资结构里。
这轮融资 500 亿,国家大基金(国家集成电路产业投资基金,中国政府主导的产业投资基金)领投。
国家大基金领投,这不是单纯的市场行为。DeepSeek 不只是一家公司,它是中国 AI 基础设施的候选建设者。
这里有个关键认知。基础设施的估值逻辑,和普通商业公司完全不同。
基础设施的经济学特征是什么?**高固定成本,低边际成本,强网络效应,自然垄断倾向。**一旦某个玩家成为标准,后来者的切换成本极高,市场会自然收敛到一两个主导者。
想想微信。微信聊天免费,但它靠支付、小程序、广告赚钱。当它成为社交基础设施之后,赚钱的方式自己找上门。微信不需要靠聊天收费,就像电网不需要靠电表赚钱,它靠的是不可替代性和规模效应。
DeepSeek 的目标,就是成为 AI 时代的微信。
这也是为什么梁文锋愿意自掏 200 亿。他不是在投资一个产品,他是在押注一个方向,AI 模型会成为像水电煤气一样的基础设施。基础设施不需要靠涨价赚钱,靠的是规模和不可替代性。
但这里有个反常识的风险,我必须说。你可能觉得基础设施一旦建成就是铁打的。其实不是。
微信从免费聊天到支付赚钱,中间花了好几年。那几年里,微信没有真正意义上的竞争对手。DeepSeek 可没有这个时间窗口。大模型的迭代速度比社交产品快得多,GPT-5、Claude 5、Gemini 2 都在路上了。
用适应性景观(Fitness Landscape)的模型来看,DeepSeek 目前站在一个局部高点上。但适应性景观不是静止的,它在持续变动。当环境变化时,今天的高点可能是明天的低谷。要到达更高的山峰,你必须先下山。而下山,意味着风险。
# 目标函数设错了,估值就是泡沫
说到科创板,这不是偶然的选择。
科创板对中国 AI 公司有一个独特的优势,它允许不赚钱的公司上市。这背后的逻辑是,用资本市场的时间来换取技术突破的空间。
寒武纪,科创板上市,前三季度营收 46 亿,同比暴增 23 倍,终于扭亏为盈。海光信息,科创板上市,一季度营收 40 亿,同比增长 68%,稳步盈利。这些公司上市的时候都不赚钱,甚至亏了很多年。但市场给了它们极高的估值,因为它们代表的是中国半导体和 AI 的国产替代逻辑。
但我必须提醒你,这条路上有前车之鉴。
AI 四小龙,商汤、旷视、云从、依图,当年也是估值几百亿的 AI 明星,也是不赚钱就上市,也是被寄予厚望。结果呢?上市后市值大幅缩水,盈利遥遥无期,赚的是辛苦钱。
为什么 AI 四小龙的估值站不住?
说白了,因为它们的目标函数设错了。
四小龙做的是非标的定制化项目——安防、智慧城市。这个市场的特征是:项目制、回款慢、利润薄、规模天花板低。你在做一个线性增长的业务,却给了它指数增长的估值。这中间的差距,就是泡沫。
大模型不一样。大模型做的是标准化产品,是智能世界的底座,通用性强,拥有平台级的想象空间。Kimi 的 K2.5 模型发布后,付费订阅与 API 调用激增,收入在一个月内暴增 1 亿美元。这就是大模型商业化的爆发力,四小龙从来没有过这种曲线。
但爆发力不等于确定性。
DeepSeek 的低价策略,到底是护城河还是牢笼?
低价帮你获取用户,但低价也锁死了你的提价空间。微信的免费聊天把用户锁住了,然后靠支付、小程序、广告赚钱。百度搜索也是免费的,但从来没有建立过同样的生态壁垒。
差别在哪?咱们来算笔账。
微信创造了一个正反馈闭环(Positive Feedback Loop)。用户越多 → 开发者越多 → 小程序越多 → 用户更离不开。这个闭环一旦启动,它就自动加强。
百度搜索没有这个闭环。用户用百度搜索信息,搜完就走。搜索行为本身不产生网络效应。
DeepSeek 能不能建成正反馈闭环,才是 3500 亿估值最终能否站住的核心问题。
# 梁文锋:从封闭系统跳到开放系统的人

回到梁文锋这个人。
他不是典型的 AI 创业者。没有 BAT 的履历,没有斯坦福的博士,没有在硅谷混过。他是广东湛江吴川人,父母都是小学语文老师。初中就把高中数学学完了,开始看大学数学。2002 年去了浙江大学读电子信息工程,后来又读了信息与通信工程的硕士,做机器视觉研究。硕士论文写的是基于低成本 PTZ 摄像机的目标跟踪算法。
低成本,高效率。从他做学术的时候,这个基因就在了。
2008 年,全球金融危机,23 岁的梁文锋在浙大读研,同时开始搞量化交易。用机器学习技术探索全自动量化交易,积累市场行情数据和宏观经济数据。2015 年创立幻方量化,到 2021 年管理规模突破千亿,成为中国最大的量化私募之一。
一个人从 23 岁开始用 AI 赚钱,到 38 岁管理千亿资金,然后他决定去做大模型。
这不是跨界,是升维。
量化交易和大模型,底层逻辑是一样的——算法 + 数据 + 算力,产生超额回报。只不过一个在金融领域的封闭系统里做优化,一个在通用智能的开放系统里做探索。
从封闭系统跳到开放系统,这个选择本身就很梁文锋。量化交易再大,也是有上限的。市场的容量是硬约束,策略会被别人抄,超额收益会衰减。但通用智能的天花板,是你想象力的天花板。说白了,他不是在换赛道,他是在换维。
# 三条行动认知

那么,对普通人来说,DeepSeek 这件事到底意味着什么?
我觉得有三点值得认真想想。
第一,定价权的转移比技术的突破更重要。
DeepSeek 最大的影响不是 R1 的性能,而是它让中国 AI 行业第一次有了自己的估值锚点。在 DeepSeek 融资之前,中国公司的估值是按美国公司打折算的。3500 亿出来之后,这个定价体系开始松动了。这不是一家公司拿了多少钱的事,是整个行业的目标函数变了。
第二,基础设施的竞争,比的是谁先建成正反馈闭环。
开源帮你快速建生态,但生态不等于闭环。全球开发者在用你的模型,不代表他们离不开你的模型。真正的护城河不是用户多,而是切换成本高。如果你在 DeepSeek 上做了大量行业微调、部署了私有化方案、接入了内部工作流,你不会轻易换到另一个模型。这个切换成本,才是闭环的真正起点。
第三,路径依赖是双向的。
DeepSeek 选择了低价路径,它会被这条路径塑造成某种形态。就像拼多多,便宜是护城河,但也是牢笼。每一个战略选择都在定义你的未来,而你很难在后来的日子里改变方向。所以关键不是选对路径,而是在路径上持续创造新的正反馈。
说到底,3500 亿的估值,买的不是 DeepSeek 的收入,而是它作为中国 AI 底座的可能性。可能性不是确定性。但在这个重尾分布的世界里,可能性的溢价,有时候比确定性更高。
梁文锋的 200 亿,赌的就是这个。
这真是一个英雄辈出,人人如龙的时代。
这个时代最值钱的东西,不是钱,是巨变发生的时候,你还在牌桌上。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标 ⭐ ~
谢谢你看我的文章,我们,下次再见。
# 常见问题
DeepSeek 3500 亿估值是怎么来的?
2026 年 5 月初,DeepSeek 完成首轮融资约 500 亿元人民币,投后估值超过 3500 亿元。此前约 23 天内,市场对其估值从约 100 亿美元升至约 515 亿美元。该数字反映资本对中国 AI 基础设施候选地位与定价权转移的预期,而非基于已披露收入的 PE 估值。
DeepSeek 公布过年收入或 ARR 吗?
没有。DeepSeek 从未正式披露 ARR 或年收入。C 端产品免费、API 定价极低,企业级付费收入尚未形成规模覆盖;行业分析中的利润率数字多为理论推算。
为什么梁文锋个人出资 200 亿?
融资结构中创始人跟投,通常被解读为对长期方向的信心信号。结合本文分析,梁文锋押注的是 AI 模型成为水电煤气级基础设施,而非短期产品收入。
DeepSeek 低价策略是护城河还是陷阱?
两者兼有,取决于能否建成正反馈闭环。低价快速获客、压低生态边际成本,但也形成路径依赖,锁死提价空间。微信靠免费社交换支付与小程序闭环;百度搜索免费却无同等网络效应——DeepSeek 落在哪一侧,决定 3500 亿能否站住。
DeepSeek 和 AI 四小龙有什么本质区别?
四小龙做非标项目制(安防、智慧城市),线性增长配指数估值,上市后估值大幅缩水。DeepSeek 走标准化通用大模型路线,具备平台级想象空间,但商业化确定性仍待验证;爆发力可参考 Kimi 等同类产品的订阅与 API 曲线,不等于 DeepSeek 已复制该路径。
本站博文如非注明转载则均属作者原创文章,引用或转载无需申请版权或者注明出处,如需联系作者请加微信: geekmaster01