Kimi和Minimax，争夺“下一个DeepSeek”心智

时间：2025-07-01 17:48:27

　　作为推理模型， Minimax -M1在长上下文理解能力上，是目前包括所有闭源和开源模型在内，能力全球前二的模型，且在训练和推理成本上有极高的性价比。

　　M1仍然延续着MoE架构，而在注意力机制上和强化学习算法上的创新让M1鲜明地区别于其他推理模型。模型总参数达到4560亿参数，原生支持100万token的上下文长度输入，以及目前所有模型中最长的80ktoken的输出长度。

　　在专业上下文能力的测评中，M1的表现远超包括 DeepSeek -R1-0528和Qwen3-235B在内的所有开源模型，甚至超越OpenAI o3和Claude 4 Opus，仅小幅落后SOTA的Gemini 2.5 Pro。

　　除了基础模型的进展，Minimax在agent以及多模态等多个领域也是亮点频出。“ 大家最近刷抖音有没有看到 ‘ 吴彦祖教你学英语 ’ ？其实是 Minimax 在提供背后的技术支持。我第一次听的时候，也难以分辨到底是真人还是AI，直到后来才知道是 Minimax 的客户，感叹这真的挺厉害的。 ”云启资本合伙人陈煜提到。

　　实用性超强的agent，能力出众的大模型，Kimi和Minimax试图开启的是一场全方位的竞速，而从更深层次上来看，两家公司更希望表达的则是，打破大众对于大模型赛道的固有心智。

　　相较于DeepSeek的光芒万丈，不得不说，此刻回头来看，Kimi与Minimax是两家曾充满遗憾的公司。

　　杨植麟清华出身，同时在卡内基梅隆大学语言技术研究所读博，导师是苹果AI负责人Ruslan Salakhutdinov和Google AI首席科学家William W. Cohen，这样的学术背景，在技术可信度上远超普通创业者。

　　而且他在循环智能等方面的创业经历，已经在企业级AI落地方面证明过自己。这更能让资本相信，这个人不只是懂技术，还会做生意。高频快速的融资，让其估值迅速爬升。

　　技术背景，管理经验，同时具有大量子弹，这让杨植麟成为前DeepSeek时代的明星。

　　更重要的是， Kimi的第一仗还打的漂亮，把长文本技术提升到了“中国AGI突破口”的高度，精准匹配了资本对其的期待。

　　但不可否定的是， DeepSeek 的爆火，一定程度上掩盖了Kimi的部分声量。

　　不过，即便是到当下，仍然可以看出，Kimi在技术实力上，仍然不逊于DeepSeek。在基础研究环节， 2月18日， DeepSeek 和月之暗面几乎同时发布了他们各自最新的论文，而主题直接—— 都是挑战Transformer架构最核心的注意力机制，让它能更高效的处理更长的上下文。而更有趣的是，两家公司的技术派明星创始人的名字，出现在各自的论文和技术报告里。

　　而在近日，两者撞车的事件又频频发生。在法律、医疗等方向招聘上的相似，潜移默化的让外界觉得，似乎Kimi仍然是能与DeepSeek并驾齐驱的存在。

　　而另一边Minimax的遗憾，则来的更为直接。在媒体的报道中，Minimax其实更早的启用了与DeepSeek相同的技术路线年下半年，大部分国内大模型厂商还在继续迭代稠密模型之际， Minimax 创始人兼CEO闫俊杰就把80%以上的研发和算力资源，投到了一件不确定的事情上—— MoE。

　　2024年1月， Minimax 上线，成为国内首个MoE大模型。此后，MoE架构彻底取代稠密架构，成了大模型领域技术迭代的新方向，而年初爆火出圈的 DeepSeek ，应用的正是 MoE。虽然无法一概而论的将两者在此维度上进行比较，但可以验证的却是两者间肉眼可见的落差。

　　客观来说，与DeepSeek技术实力难分伯仲的Kimi与Minimax，在市场中早已无法得到与之匹配的影响力。

　　而从这个维度上来看，没有被大厂打败，而是被DeepSeek超越，也让两家在下一个周期即agent的争夺中，渴望着一场真正意义上的翻身仗。

　　正如戴雨森所言“ 我们不是因为大模型投资 Kimi ，而是投资团队。现在是技术革命的早期，他们仍然是拥有中国最优秀团队的AI创业公司之一，以及拥有最多资源的AI创业公司之一。如果我们相信AI是一件非常大的事，你有最好的团队，又有最多资源，仍然能够做出很多有意思的事来。 ” 而AI的下半场，是否仍会按照当下大厂主导，DeepSeek重点突破的模式演绎，似乎仍然是一道谜题。

　　进入6月，AI圈似乎达到了比以往更为热闹的情景。罗永浩数字人直播带货拿下天量成交，夸克与元宝在高考报志愿竞逐，同时，豆包上线了AI播客功能，美团高层点了第一杯AI外卖咖啡，AI的想象力与应用正在不断加速地渗透至生活的各个角落。

　　这一切的快速演变，似乎让人看到了红杉AI峰会中所提到的，下一轮 AI，卖的不是工具，而是收益。

　　但与此同时，对于agent未来演变的辩论也在持续。拾象CEO李广密曾坦言 Agent与当前模型能力的匹配程度。他认为，今天Agent 80%的能力依赖于模型这个引擎。比如，GPT到了3.5，多轮对话的通用范式出现了，Chatbot这种产品形态就行得通了。Cursor的崛起也是因为模型发展到了Claude 3.5的水平，它的代码补全能力才得以成立。

　　而 AI Research Lead钟凯祺则认为：通用Agent的需求基本上就是信息检索和轻度代码编写这两类，而GPT-4o已经完成得非常好了。因此，通用Agent市场基本上是大模型公司的主战场，创业公司很难仅仅通过服务于通用需求来做大。而创业公司基本都聚焦在垂直领域。

　　回到的主角：当 Kimi 用深度研究Agent叩开垂类专业场景的大门，当 Minimax 以推理模型M1刷新开源能力边界，

　　DeepSeek 的崛起证明，在大厂与创业公司的博弈中，技术突破与市场定位的精准耦合，足以重塑行业认知 —— 而这正是 Kimi 与 Minimax 此刻最迫切的目标。

　　从技术路径看， Kimi 押注“垂直 Agent”，试图用“深度研究”的专业标签切割出差异化赛道； Minimax 则试图用线性注意力机制打出差异化，通过多模态能力构建全场景渗透的想象空间。两者的策略差异，本质是对“AI下半场生存法则”的不同解读：前者选择在大厂尚未重兵布防的垂类扎根，用“高实用性”对抗大厂的流量优势；后者则延续“全栈布局”的野心，试图以技术性价比弥补生态短板。

　　但这场争夺的关键，或许正如戴雨森所言——“投资团队而非模型”。当 DeepSeek 用技术叙事改写资本逻辑， Kimi 与 Minimax 的核心竞争力，仍在于创始团队对技术趋势的预判能力。在大厂凭借资源优势加速内卷的当下，创业公司的破局点从来不是 “硬碰硬”，而是像 DeepSeek 那样，在某个技术维度建立不可替代的认知优势，进而占领用户心智。

　　今的AI下半场，既是技术落地的“马拉松”，也是心智认知的“闪电战”。 Kimi 与 Minimax 的每一次开源、每一个Agent的迭代，都是在为 “下一个 DeepSeek ” 的叙事加码。而当行业泡沫逐渐消散，真正能穿越周期的，或许正是那些既能在技术深水区扎根，又能在用户心智中刻下独特标签的团队。这场没有硝烟的战争，才刚刚开始。

　　字母榜，《闫俊杰不甘心》字母榜，《minimax的好日子来了？》王智远，《 Kimi还能找到月之亮面吗？》凤凰网财经，《 Kimi和 DeepSeek 又撞车？》暗涌，《一年后，当Kimi和MiniMax投资人再坐到一起》极客公园，《巨头博弈下，Agent 的机会和价值究竟在哪里？》36氪，《开源还要IPO？MiniMax不想被遗忘在这个夏天》月之暗面，《模型即 Agent，Kimi-Researcher开启内测》极客公园，《 MiniMax-M1 登场，MiniMax 再次证明自己是一家模型驱动的 AI 公司》

上一篇：Canada Scraps Digital Services Tax to Resume Trade Talks with U.S. 返回首页

下一篇：朴朴十年拓九城，“平替”盒马何时飞升

热点推荐

1 Bitget与苏黎世联邦理工学院谷歌开发者社

全球最大的通用交易所 Bitget 宣布与苏黎世联邦理工学院的 Google 开发者社区建立年度合作伙伴...

2 波兰下议院再次批准加密货币法案，并将

波兰议会下院已通过《加密资产市场法案》，该法案与此前被总统卡罗尔纳沃罗茨基否决的版...

3 交易者预计比特币短期或将出现反弹，

消息，12 月 19 日，交易者预计比特币短期可能反弹，数据显示，BTC/USD 的相对强弱指数处于极...

4 Coinbase因违反反洗钱规定面临2150万欧元罚

爱尔兰中央银行因Coinbase Europe在反洗钱方面存在失职，对其处以2150万欧元的罚款。原因是其外...

5 花旗银行预测比特币明年或达18.3万美元