飞行的蜗牛 
作者视角:本文基于近期大厂 AI 算力/API 聚合平台布局、运营商 Token 套餐趋势,以及中小 API 聚合平台关停现象展开分析。本文不构成任何投资建议。
先说结论(截至 2026-05):低价 API 中转的红利正在消退。 阿里云百炼、火山方舟、百度千帆、腾讯云、华为云及三大运营商 Token 套餐,正把 AI API 生意从草莽中转推向正规化算力平台——比的是合规、稳定、模型路由与开发者生态,而不是谁更便宜。对中小开发者:应假设底层成本会上升,竞争力从倒卖 Token 转向场景交付与 Token 成本工程;机会没有消失,而是从底层中转转向上层垂直场景。
API 聚合平台(也常被称为 API 代理、反代、聚合 API)指:在不直接签约各家模型厂商的前提下,将多模型调用、计费与风控聚合成单一 API 入口,再转售给开发者或企业的二级聚合服务。




你有没有想过一个细思极恐的问题:你去急诊,分诊台后面坐着的,可能不是人。
这不是科幻。这是哈佛医学院上周发表在《Science》上的一项研究——OpenAI 的 O1 推理模型,在急诊分诊诊断中的准确率达到了 67%,而跟它对阵的两位主治医师,只有 50% 和 55%。
67% vs 50%。
在生死攸关的急诊分诊环节,AI 赢了。


先说结论:Qwen 不是“突然闭源”,而是在做选择性收缩。阿里保留基座模型开源来维持生态漏斗,同时把最有商业价值的前沿多模态能力锁进 API 付费墙。这背后不是理念之争,而是现金流与收入结构驱动的商业算术。
事情是这样的。

事情是这样的。
上周五(2026 年 4 月 24 日),DeepSeek 发布了 V4。
两个版本,V4-Pro-Max 1.6 万亿参数,V4 Flash 284 亿参数,都是 MoE 架构,都支持 100 万 token 上下文窗口。V4 Flash 的定价是每百万输入 token 0.14 美元,几乎是同级别模型里最便宜的。
然后华为紧接着宣布,全系列 Ascend 芯片对 V4 提供完整支持。寒武纪也第一时间跟进了兼容性适配。
如果你关注 AI 行业的话,应该能感觉到,这一周的信息密度有多高。

4 月 16 号,Anthropic 发了个 Claude Opus 4.7。4 月 23 号,OpenAI 紧跟着发了个 GPT-5.5。4 月 24 号,DeepSeek 又蹦出来个 V4。
9 天之内,三家先后出牌,全部百万 token 上下文,全部主打 Agentic 能力。
我看完了这三场发布会的感觉就是,之前那种「谁是最强模型」的讨论,好像突然变得没意义了。
不是因为谁碾压了谁。
恰恰相反,是因为谁也没碾压谁。
三足鼎立了。

最近新一代个人 AI 助理 Hermes Agent 风头正盛,GitHub 上每天的 star 增长已经悄悄超过了 OpenClaw,大有取而代之的势头。不少网友跑来问我:这个新 AI 代理到底好不好用?网上都在说“爱马仕”(Hermes)比“小龙虾”(OpenClaw)好用,是不是真的?建不建议切换?
于是,我分别用我的小龙虾和爱马仕做了一轮深度调研——把两者的架构、代码、社区声音扒了个底朝天。同时我自己也用了差不多三个月的小龙虾、又深度使用了 2 周的 Hermes,踩了一堆坑,也攒了一堆体感。我想写一篇 既有数据、又有体感的文章,帮你理清楚这两个东西到底是个啥,各自的使用场景是什么,以及——到底选哪个。
