当前位置:主页 > 推荐 >

MiniMax M3正式开源,原生多模态支持百万上下文

时间:2026-06-12 23:43:39

  消息,MiniMax在Hugging Face正式开源其原生多模态混合专家模型MiniMax M3,参数总量4280亿,单token激活230亿,支持100万超长上下文。为降低显存开销,开发团队发布了MXFP8量化版本,并适配SGLang、VLLM、Transformers等推理框架。MiniMax M3在预训练阶段开展文本、图像与视频联合训练,实现原生语义融合。模型提供思考模式和非思考模式两种推理方式,支撑百万超长上下文的底层内核是轻量化注意力内核库MiniMax Sparse Attention。MSA采用分组查询注意力机制,在100万token的实测中,针对NVIDIA Blackwell架构优化的MSA算子实现了9倍以上的预填充加速和15倍的解码提速,同时降低了推理开销。

热点推荐
1 Zcash审计发现未新增严重漏洞

消息,Zcash在Anthropic的Mythos系统下进行了后续安全审计,创始人Zooko Wilcox表示,审计未发现任何...

2 主力24h动向:BTC大户成交限价卖单更多,

消息,主力在最近24小时内的成交数据显示,BTC累计成交7.58亿美元,其中买成交3.03亿美元,卖...

3 以军向黎巴嫩20个地区居民发布撤离令

消息,以色列国防军阿拉伯语发言人13日在社交媒体上发布撤离令,警告即将对黎巴嫩发动空袭...

4 分析师:美国现货比特币ETF本周净流出

消息,据Farside Investors数据显示,美国现货比特币ETF本周合计净流出3.193亿美元。其中,贝莱德...

5 在以色列北部响起警报后

消息,据以色列i24电视台:在以色列北部响起警报后,以色列国防军拦截了一架从黎巴嫩飞来...

6 某巨鲸出售$SIREN获利750万美元,仍持有

消息,据Lookonchain监测,某$SIREN巨鲸已通过出售$SIREN获得超过750万美元,目前仍持有5.957亿枚...

7 字节豆包大范围上线任务模式:支持网页

消息,字节跳动旗下AI应用豆包推出任务模式,支持网页与PPT生成,思考模式升级为专家模式。...

8 Galaxy Research:比特币周期底部区间预计在

消息,Galaxy Research研究员Alex Thorn分析称,比特币本轮周期顶部信号温和,网络成本基础占历史...

9 Metaplanet收购Siiibo开发日本比特币金融产品

消息,Metaplanet宣布收购Siiibo,以在日本开发与比特币相关的金融产品。...

10 创世巨鲸向Coinbase存入57.61万枚HYPE,价值

消息,据onchain lens监测,一位HYPE创世巨鲸将持有的全部57.6148万枚HYPE存入Coinbase,按实时价格计...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。