文 | 象先志
前天晚上,月之暗面发布 Kimi K2.6,并把 API 输入价格从每百万 token 0.60 美元调到 0.95 美元。
涨了 58%。K2 系列上线以来第一次涨价。
但似乎没有人在关注这件事。
四个月前,2025 年最后一天的内部信里,杨植麟写月之暗面"短期不急于 IPO "。那时候智谱和 MiniMax 的招股书都已经递到港交所了,这显然是一种刻意的身位区分。
他还在那封信里写,公司现金储备超过 14 亿美元,C 轮 5 亿美元超额认购——潜台词是,一级市场的潜能还没充分发挥,二级市场不急。
三个月后,彭博爆料他开始接触中金和高盛。又过了三周,K2.6 上线。
一个不喜欢"急"的人,四个月里做完了他之前说自己不做的那件事。
K2.6 一定不是月之暗面上市前的最后一次产品发布。但这次版本发布,却是月之暗面计划上市后,杨植麟的第一场路演。
Kimi 从没这样发过一版模型
Kimi 过去发模型有一套固定动作。
发技术报告、开源权重、刷 HuggingFace 榜,然后等技术社区的审视。K1.5 对标 o1 做推理方法论,技术细节比 benchmark 数字还多;K2 Thinking 直接把权重丢上 HuggingFace,让开发者自己跑测试。这些动作都是写给开发者和研究者看的。
话术也是技术社区那一套:我们解决了什么问题,我们的方法为什么更好,欢迎复现。
K2.6 的动作不太一样。
先说涨价。人民币口径里,K2.6 每百万 token 的输入价格是 6.5 元(缓存未命中),K2.5 是 4 元。输出价格从 21 元涨到 27 元。缓存命中价格是 1.1 元。
这是一次结构化涨价。表面上所有档位都在涨,但缓存命中档的涨幅最小——从 0.7 元涨到 1.1 元,美元计价是 0.16 美元 / 百万 token。
这个 0.16 美元是读懂这次涨价的钥匙。
对长期调同一个 system prompt 的企业用户:代码助手、Agent 编排框架、智能客服他们的 prefix 高度复用,缓存命中率能跑到 75% 到 83%。月之暗面给这批客户留了接近持平的价格。
对偶尔用一次、prompt 每次都不一样的零散客户,这次涨价足额落到了他们头上。
这是一次针对"已经绑在 Kimi 上的企业"的友好调价,和一次针对"还在比价的散客"的不友好调价。前者是上市故事里的"企业级锁定客户",后者是路演 PPT 上不会出现的"长尾用户"。月之暗面很清楚哪些人是它的估值资产。
Agent 时代的算力结构和对话时代不一样。对话模型是几十个 token 的往返,Agent 是几千次工具调用和几十万 token 的消耗。K2.6 官方案例里—— Mac 本地部署 Qwen3.5 模型调用工具 4000 余次、持续 12 小时,重构开源撮合引擎 exchange-core 13 小时 1000 余次工具调用,更极端的是 5 天自主运行监控告警、故障响应——这些单次任务的 token 消耗,是 K2.5 时代对话场景的几百倍甚至上千倍。
当然,这套案例是用来讲长程推理能力的,但加上这次 K2.6 的 300 agent 集群,但 token 的消耗量一定惊人。
按 0.60 美元的老定价,这种 Agent 任务单次调用可能亏钱。按 0.95 美元,勉强覆盖推理成本。
所以涨价不是自信,是必须。月之暗面累计融资 25 亿美元,C 轮到 C+ 轮有 14 亿美元现金储备,但下一代 K3 如果真是 3-4 万亿参数规模,一轮预训练可能就吃掉其中一半。
不涨价,上市前最后几个季度的毛利数据会难看。招股书是要披露毛利率的。

这件事本来可以大大方方讲—— Agent 时代需要新的定价模型。但月之暗面没讲。因为 C 端用户刚从 K2 Thinking 的免费时代过来,现在对着他们讲"我涨价了"不是好的产品故事。
它是讲给另一个听众的故事—— Kimi 已经有一批离不开它的企业客户,贵一点他们也要用。(比如我自己)
第二件事是基准对标。K2.6 官方挑的参照物是 GPT-5.4、Claude Opus 4.6、Gemini 3.1 Pro。三个都是前一代旗舰。
同一周,Anthropic 发了 Claude Mythos,Opus 4.7 也刚上线——两个都比 Opus 4.6 强一代。K2.6 没对标它们。
这其实是主动选择。对标 Mythos,K2.6 落在"追赶者"的位置;对标 Opus 4.6,K2.6 就落在"第一梯队"的位置。180 亿美元估值需要后者。
Kimi 过去不太做这种事。K2 Thinking 发布的时候,官方直接跑了全量 benchmark,有好成绩也有差成绩,全部放出来让开发者自己判断。那是技术社区的玩法——社区看得懂你哪里强、哪里弱,也愿意接受一个有明显短板但路线清晰的模型。
路演 PPT 不是。路演 PPT 需要一个基金经理 30 秒内看懂的结论"持平或优于国际顶尖闭源模型"。这句话是 K2.6 官方博客的原文。
第三件事是 Agent 集群和开源双轨。K2.6 升级了一个叫 Claw Groups 的东西——异构 Agent 生态,不同设备、不同模型、不同工具链的 Agent 在一个协作空间里运行,K2.6 担任调度者。300 个子 Agent 并行,4000 步协同,5 天自主运行。
这些数字是写给企业客户的。不是写给开发者的。对一个开发者来说," 300 个 Agent 并行"没有实际意义——他不会在一个本地项目里跑 300 个 Agent。这个配置只对一种客户有意义:需要用 Agent 矩阵自动化运营全流程的大企业。
对标的是 Salesforce 的故事,不是 HuggingFace 的故事。
同时 K2.6 全面开源。杨植麟在 3 月 26 日中关村论坛说,开源会是绝对的胜利。
开源 + 企业级 Agent 集群,这是 DeepSeek 和 Anthropic 中间的位置,两种模式都占一半。听起来是好故事。但两头都占,意味着两头都要证明。
资本市场其实不在乎这些问题有没有答案。它只要求你每条线都有故事。
涨价、对标、Agent 集群——这三件事放在一起,有一个反常的共同点。没有一件是为了技术社区。
Kimi 过去发模型的底层逻辑是——如果开发者喜欢我,企业客户迟早会跟上,资本市场更迟早会跟上。这套打法有一个名字,叫技术诚意。
K2.6 不等了。涨价是 B 端定价权的直接宣告,对标 GPT-5.4 是估值位置的提前卡位,Agent 集群和 Claw Groups 是企业服务故事的样板间。
每一件事都对应着路演 PPT 上的一个问题:你的商业化能力是什么?你的对标位置是什么?你的 B 端壁垒是什么?
从 Preview 到 GA 压缩到 8 天,也是这个逻辑。K2 系列之前的版本都走过 2-3 个月的预览期,让社区测够、反馈够、迭代够。K2.6 没给自己这个空间。不是技术成熟得更快了,是窗口期不等人。
2026 年下半年 IPO,按港交所的流程要留 4 到 6 个月递表、问询、聆讯、路演、定价、冷静期。9 月启动路演,意味着 4 月就要把产品准备好。
4 月不发 GA,后面就没有窗口了。
K3 才是真正的压轴
但 K2.6 也不是月之暗面能拿出来的最强一张牌。
官方博客里有一句很克制的话——K2.6 是"为 K3 准备的 runway "。
12 小时长程编码、300 Agent 集群、上下文压缩器——这些不是 K2 系列的终点形态,是更大基座模型能够承载的执行层基础设施。月之暗面不会花力气把这套东西跑通,除非很确定有一个更大的模型要消耗这些能力。
Reddit 早前流出过关于 K3 的消息,目标参数规模 3-4 万亿。对比 K2 系列的万亿规模,这是一次基座跃迁。
如果 K3 能赶在路演窗口发——那是真正的答卷。K2.6 铺好的 runway,K3 起飞。
问题是能不能赶上。训一个 3-4 万亿参数模型要多久?GPT-5 和 Claude Opus 4.6 都是大约 6-9 个月预训练周期,后训练和安全评估再加几个月。月之暗面现有的算力——按阿里云的合作和当下现金储备来看——能不能把这个周期压缩到 5-6 个月?
这个赌注下在了 K2.6 上。
八天 Preview 到 GA、Agent 集群一口气从 100 扩到 300、长程执行从几百步拉到 4000 步——每一个动作都在压缩时间,都在为 K3 的可能性腾空间。
如果 K3 能在 8、9 月前发——那是路演上的压轴曲目。
如果赶不上—— K3 就成了"上市之后才能发的模型",K2.6 就要一个人撑起全部估值叙事。
月之暗面赌的就是能做到。
180 亿美元估值锚定的是什么
回到估值。
三个月前月之暗面估值 43 亿美元,两个月前 55 亿美元,现在 180 亿美元。
不是月之暗面这三个月变强了四倍。是智谱和 MiniMax 上市之后涨了 4 倍,把整个赛道的天花板顶起来了。智谱港股市值 3050 亿港元,MiniMax 3092 亿港元——两家市值都超过了商汤的历史最高点。
这两家的市值逻辑不是"下一代技术能做到什么",是"在港股这个池子里,AI 资产能被定价到多少"。
月之暗面 180 亿美元估值锚定的是同一件事。它不再是在证明自己是最强的中国 AI 公司,它在证明自己是可以被定价的中国 AI 公司。
K2.6 所有的动作——涨价、对标、Agent 集群、开源双轨——都在回应这个命题。
但有一件事 K2.6 还没有证明。Kimi 的 C 端用户愿不愿意为涨价后的 K2.6 买单?付费订阅用户会不会流向 DeepSeek 或 MiniMax?企业客户里有多少在真的跑 Claw Groups,多少只是签了 POC?
这些数字是路演的时候投资人一定会问的。K2.6 现在只能把产品摆出来。它能不能变成数字,要看未来三个月。
智谱上市的时候递上去的是利润还没转正的招股书,MiniMax 也是。投资人接受了这个故事,是因为那时候"中国 AI 资产"这个大叙事刚打开。月之暗面来晚了半年。同样的问题,智谱 MiniMax 可以说"我们在验证",月之暗面要说"我们在变现"。
这个压力全部落在 K2.6 到 K3 之间的三个月里。
所以回到最初那个问题——K2.6 是月之暗面上市前的最后一场路演吗?
不是。
如果 K3 赶上路演窗口,K3 才是真正的压轴。K2.6 只是为它铺好的跑道。如果 K3 赶不上路演窗口,K2.6 就要扛完整个上市叙事。那它就是杨植麟被迫提前开讲的第一场。
哪一个结果,四个月前都不是杨植麟想要的。
但这四个月里发生的所有事情——智谱 MiniMax 上市、估值天花板被顶起、窗口期压缩——都让一个不喜欢"急"的人,不得不急起来。
K3 发的时候,是第二场。