作为推理模型, Minimax -M1在长上下文理解能力上,是目前包括所有闭源和开源模型在内,能力全球前二的模型,且在训练和推理成本上 有 极高的性价比。
M1仍然延续着MoE架构,而在注意力机制上和强化学习算法上的创新让M1鲜明 地 区别于其他推理模型。模型总参数达到4560亿参数,原生支持100万token的上下文长度输入,以及目前所有模型中最长的80ktoken的输出长度。
在 专业上下文能力的测评 中,M1的表现远超包括 DeepSeek -R1-0528和Qwen3-235B在内的所有开源模型,甚至超越OpenAI o3和Claude 4 Opus,仅小幅落后SOTA的Gemini 2.5 Pro。
除了基础模型的进展,Minimax在agent以及多模态等多个领域也是亮点频出。“ 大家最近刷抖音有没有看到 ‘ 吴彦祖教你学英语 ’ ?其实是 Minimax 在提供背后的技术支持。我第一次听的时候,也难以分辨到底是真人还是AI,直到后来才知道是 Minimax 的客户,感叹这真的挺厉害的。 ”云启资本合伙人陈煜提到。
实用性超强的agent,能力出众的大模型,Kimi和Minimax试图开启的是一场全方位的竞速,而从更深层次上来看,两家公司更希望表达的则是,打破大众对于大模型赛道的固有心智。
相较于DeepSeek的光芒万丈,不得不说,此刻回头来看,Kimi与Minimax是两家曾充满遗憾的公司。
杨植麟 清华出身, 同时在 卡内基梅隆大学语言技术研究所读博,导师是苹果AI负责人Ruslan Salakhutdinov和Google AI首席科学家William W. Cohen,这样的学术背景,在技术可信度上远超普通创业者。
而且他 在 循环智能 等方面的创业经历 ,已经在企业级AI落地方面证明过自己。这 更能 让资本相信,这个人不只是懂技术,还会做生意。 高频快速的融资,让其估值迅速爬升。
技术背景,管理经验,同时具有大量子弹,这让杨植麟成为前DeepSeek时代的明星。
更重要的是, Kimi的第一仗还打的漂亮, 把长文本技术提升到了“中国AGI突破口”的高度,精准匹配了资本对 其的期待。
但不可否定的是, DeepSeek 的爆火,一定程度上掩盖了Kimi的部分声量。
不过,即便是到当下,仍然可以看出,Kimi在技术实力上,仍然不逊于DeepSeek。在基础研究环节, 2月18日, DeepSeek 和月之暗面几乎同时发布了他们各自最新的论文,而主题直接—— 都是挑战Transformer架构最核心的注意力机制,让它能更高效的处理更长的上下文。而更有趣的是,两家公司的技术派明星创始人的名字 , 出现在各自的论文和技术报告里。
而在近日,两者撞车的事件又频频发生。在法律、医疗等方向招聘上的相似,潜移默化的让外界觉得,似乎Kimi仍然是能与DeepSeek并驾齐驱的存在。
而另一边Minimax的遗憾,则来的更为直接。在媒体的报道中,Minimax其实更早的启用了与DeepSeek相同的技术路线年下半年,大部分国内大模型厂商还在继续迭代稠密模型之际, Minimax 创始人兼CEO闫俊杰就把80%以上的研发和算力资源 , 投到了一件不确定的事情上—— MoE。
2024年1月, Minimax 上线,成为国内首个MoE大模型。此后,MoE架构彻底取代稠密架构,成了大模型领域技术迭代的新方向, 而 年初爆火出圈的 DeepSeek , 应用的正是 MoE。 虽然无法一概而论的将两者在此维度上进行比较,但可以验证的却是两者间肉眼可见的落差。
客观来说,与DeepSeek技术实力难分伯仲的Kimi与Minimax,在市场中早已无法得到与之匹配的影响力。
而从这个维度上来看,没有被大厂打败,而是被DeepSeek超越,也让两家在下一个周期即agent的争夺中,渴望着一场真正意义上的翻身仗。
正如戴雨森所言“ 我们不是因为大模型投资 Kimi ,而是投资团队。现在是技术革命的早期,他们仍然是拥有中国最优秀团队的AI创业公司之一,以及拥有最多资源的AI创业公司之一。 如果我们相信AI是一件非常大的事,你有最好的团队,又有最多资源,仍然能够做出很多有意思的事来。 ” 而AI的下半场,是否仍会按照当下大厂主导,DeepSeek重点突破的模式演绎,似乎仍然是一道谜题。
进入6月,AI圈似乎达到了比以往更为热闹的情景。罗永浩数字人直播带货拿下天量成交,夸克与元宝在高考报志愿竞逐,同时,豆包上线了AI播客功能,美团高层点了第一杯AI外卖咖啡,AI的想象力与应用正在不断加速地渗透至生活的各个角落。
这一切的快速演变,似乎让人看到了红杉AI峰会中所提到的, 下一轮 AI,卖的不是工具,而是收益。
但与此同时,对于agent未来演变的辩论也在持续。拾象CEO李广密曾坦言 Agent与当前模型能力的匹配程度。 他认为, 今天Agent 80%的能力依赖于模型这个引擎。比如,GPT到了3.5,多轮对话的通用范式出现了,Chatbot这种产品形态就行得通了。Cursor的崛起也是因为模型发展到了Claude 3.5的水平,它的代码补全能力才得以成立。
而 AI Research Lead钟凯祺 则认为:通用Agent的需求基本上就是信息检索和轻度代码编写这两类,而GPT-4o已经完成得非常好了。因此,通用Agent市场基本上是大模型公司的主战场,创业公司很难仅仅通过服务于通用需求来做大。而创业公司基本都聚焦在垂直领域。
回到的主角: 当 Kimi 用深度研究Agent叩开垂类专业场景的大门,当 Minimax 以推理模型M1刷新开源能力边界,
DeepSeek 的崛起证明,在大厂与创业公司的博弈中,技术突破与市场定位的精准耦合,足以重塑行业认知 —— 而这正是 Kimi 与 Minimax 此刻最迫切的目标。
从技术路径看, Kimi 押注“垂直 Agent”,试图用“深度研究”的专业标签切割出差异化赛道; Minimax 则 试图用 线性注意力机制 打出差异化 ,通过多模态能力构建全场景渗透的想象空间。两者的策略差异,本质是对“AI下半场生存法则”的不同解读:前者选择在大厂尚未重兵布防的垂类扎根,用“高实用性”对抗大厂的流量优势;后者则延续“全栈布局”的野心,试图以技术性价比弥补生态短板。
但这场争夺的关键,或许正如戴雨森所言——“投资团队而非模型”。当 DeepSeek 用技术叙事改写资本逻辑, Kimi 与 Minimax 的核心竞争力,仍在于创始团队对技术趋势的预判能力。在大厂凭借资源优势加速内卷的当下,创业公司的破局点从来不是 “硬碰硬”,而是像 DeepSeek 那样,在某个技术维度建立不可替代的认知优势,进而占领用户心智。
今的AI下半场,既是技术落地的“马拉松”,也是心智认知的“闪电战”。 Kimi 与 Minimax 的每一次开源、每一个Agent的迭代,都是在为 “下一个 DeepSeek ” 的叙事加码。而当行业泡沫逐渐消散,真正能穿越周期的,或许正是那些既能在技术深水区扎根,又能在用户心智中刻下独特标签的团队。这场没有硝烟的战争,才刚刚开始。
字母榜,《闫俊杰不甘心》字母榜,《minimax的好日子来了?》王智远,《 Kimi还能找到月之亮面吗? 》凤凰网财经,《 Kimi和 DeepSeek 又撞车? 》暗涌,《 一年后,当Kimi和MiniMax投资人再坐到一起 》极客公园,《 巨头博弈下,Agent 的机会和价值究竟在哪里? 》36氪,《 开源还要IPO?MiniMax不想被遗忘在这个夏天 》月之暗面,《 模型即 Agent,Kimi-Researcher开启内测 》极客公园,《 MiniMax-M1 登场,MiniMax 再次证明自己是一家模型驱动的 AI 公司 》
全球最大的通用交易所 Bitget 宣布与苏黎世联邦理工学院 的 Google 开发者社区建立年度合作伙伴...
2 波兰下议院再次批准加密货币法案,并将波兰议会下院已通过《加密资产市场法案》,该法案与此前被总统卡罗尔纳沃罗茨基否决的版...
3 交易者预计比特币短期或将出现反弹,消息,12 月 19 日,交易者预计比特币短期可能反弹,数据显示,BTC/USD 的相对强弱指数处于极...
4 Coinbase因违反反洗钱规定面临2150万欧元罚爱尔兰中央银行因Coinbase Europe在反洗钱方面存在失职,对其处以2150万欧元的罚款。原因是其外...
5 花旗银行预测比特币明年或达18.3万美元消息,据BitcoinTreasuries发推称:花旗银行预测比特币明年或达18.3万美元,称当前下跌是暂时的...
6 贝莱德向 Coinbase 存入 36,579 枚 ETH,价值消息,12 月 19 日,据 Onchain Lens监测,贝莱德向 Coinbase 存入 36,579 枚 ETH,价值 1.084 亿美元。...
7 从酒都到酒旅:宜宾的酒+旅融合新叙事501元明古窖池群在国庆期间开街运营,以410余场主题活动接待游客超23万人次,成为现象级文旅...
8 SEC 指出比特币 (BTC) 矿机托管服务受证券消息,美国证券交易委员会起诉比特币矿机托管服务商VBit,指控其托管协议属于证券,但行业...
9 聚焦技术转化新路径 科研人才创业如何赋从实验室走向产业,科研项目如何跨越市场的最后一公里?随着科创热潮持续升温,这一议题...
10 美联储称:全球债务市场显示美元(USD)消息,美联储研究显示,美元在全球债券市场中的主导地位呈现周期性波动,而非长期单向趋...
成都来彰科技 蜀ICP备2025134723号-1
资讯来源互联网,如有版权问题请联系管理员删除。