19520416194
NEWS
先知先行科技公司及AI前沿相关资讯

开发者实测Kimi K2:兼容Claude Code、Agent表现超预期,中国大模型首次让API价格腰斩

日期:2025-09-05 访问:6次 作者:admin

嘿,各位关注AI的朋友们!最近大模型圈是不是又有点“卷”不动了?别急,新主角来了!

国内大模型独角兽“月之暗面”最近放大招了!他们不仅发布了,还开源了最新一代的MoE(混合专家模型)架构基础模型——Kimi K2。这消息一出,立马在海外开发者圈掀起了不小的波澜。

01两天超过马斯克xAI?这速度有点快!


有数据显示,Kimi K2推出还不到48小时,就在API聚合平台OpenRouter上的token使用量,超越了刚刚发布号称“全球最强AI”Grok 4的马斯克创立的xAI公司。这速度,简直让人怀疑是不是“封神”了?

官方介绍,Kimi K2是月之暗面首款开源的旗舰模型,参数量直接拉满到1万亿(1T),激活参数32B,现在已经在Kimi的网页和App上能用了。有网友感叹:“万亿参数的模型,居然开始在非英伟达的硬件上流畅跑了!” 更大胆的猜测是:如果中国实验室能玩转巧妙的路由策略,用更少的芯片跑出更强的智能,那英伟达在AI硬件上的“老大哥”地位,是不是该有点“颤抖”了?这被形象地称为“压力下的创新”——拿不到高端芯片?没关系,咱们重新设计,让自研硬件也能大放异彩!

02实力如何?开发者实测:比预期还惊喜!


光说参数没用,得看真本事。在代码生成、智能体(Agent)能力、工具调用这三项关键基准测试中,Kimi K2拿下了开源模型里的SOTA(当前最佳)成绩。这还不算完,在实际场景中,它也展现了更强的泛化能力和实用性。比如,在前端开发里,能生成既美观又实用的代码;能自动把需求拆解成规范可执行的“工具调用”指令;还能根据要求,轻松切换各种文风来改写文本。

这几天,不少开发者分享了他们的实测感受和对比。结果嘛,Kimi K2在各种测试中不仅没掉链子,表现甚至比官方预期还要亮眼!网上充斥着这样的评价:“不输Claude 4,但便宜80%!”、“可能是唯一能超越R1(指R1智能体)的存在…” 听起来是不是有点“牛皮”?

03对比测试:Kimi K2 vs Claude Code,谁更香?


很多用户直接“硬刚”,把Kimi K2连到了Claude Code上测试。为啥能这样?因为Kimi K2的API服务兼容性超强,能对接OpenAI和Anthropic的格式,和各种框架也玩得来。

一位开发者对比后总结:Kimi K2的编码能力杠杠的,跟Claude 4基本一个水准,但成本只要Claude 4的20%!唯一的“槽点”是API响应稍微慢了那么一丢丢。另一位多年AI从业者刘小排也分享体验:“用Kimi K2驱动Claude Code,编程能力跟原版差别不大,能替代85%的场景。要是用DeepSeek驱动,估计只能替代60%。”

有网友评论得挺有意思:“能用Kimi K2跑Claude Code,这事挺有意思。说明Claude这套Agent架构,其实啥模型都能用,理论上Gemini、Grok、o3也行。选择权,最终还是用户说了算!”

除了编码,Kimi K2在Python数据分析、网站生成上也是“小菜一碟”。有用户甚至用Kimi K2几乎独立“造”了一个前端组件库,全程没借“外力”,就用了简单的提示词,效果却惊艳。还有用户表示,用它做创意写作和角色扮演,效果拔群,甚至觉得中文创意写作能力是“唯一能超越R1的存在”。

04“高性价比”的秘密:技术创新是关键


Kimi K2为啥这么“能打”又“便宜”?月之暗面揭秘了背后的技术:预训练用了他们自研的MuonClip优化器,能让万亿参数模型又稳又快地训练起来。在高质量人类数据越来越稀缺的情况下,这优化器能有效提高Token利用效率,找到新的性能提升空间。此外,还有大规模智能体工具使用数据合成、引入自我评价机制的通用强化学习等技术加持。

月之暗面解释说,在数据有限、模型配置固定的情况下,Token利用率越高的优化器,产生的智能就越多。他们之前的项目Moonlight就证明了,Muon优化器比常用的AdamW强不少。

05“撞车”DeepSeek?还是英雄所见略同


有意思的是,Kimi K2的架构和DeepSeek V3高度相似,主要区别是“注意力头数量更少、专家数量更多”。月之暗面在技术博客里也承认,Kimi K2的设计目的是在Moonlight基础上进一步扩展,所以架构和DeepSeek-V3很像。他们基于缩放律分析,减少了注意头数量来提升长上下文效率,增加了MoE的稀疏性来提高Token效率。

这已经不是月之暗面和DeepSeek第三次在研究方向上“不谋而合”了。今年2月,两家公司都提出了挑战Transformer核心注意力机制的新架构;4月,又分别推出了用于数学定理证明的大模型,技术报告里都提到了强化学习。

06智能体能力的“进化”:数据合成+强化学习


Kimi K2智能体能力的提升,主要靠两点:大规模智能体数据合成和通用强化学习。为了让模型学会用复杂的工具,他们借鉴了ACEBench,开发了一套能模拟现实工具使用场景的流程,系统性地扩展了包含数千工具的数百个领域(既有真实工具,也有合成工具),然后生成了数百个拥有多样化工具集的智能体。


07回归基础,厚积薄发


据悉DeepSeek意外爆火后,月之暗面就收敛了市场投放,把重心放回了基础模型研发。之前也有消息称,他们在布局AI医疗,提升Kimi在专业搜索领域的表现,并探索Agent产品方向,发布了Deep Research等。

Kimi K2发布当晚,联合创始人张宇韬在朋友圈直接喊话:“Make Kimi Great Again!” 看来,月之暗面对Kimi K2寄予厚望,希望它能成为在DeepSeek冲击下,让公司重新站稳脚跟的关键一役。

好了,关于Kimi K2的种种“神迹”,今天就聊到这里。你对这款新模型有什么看法?欢迎在评论区留言讨论!