当前位置:主页 > 快讯 >

微博开源VibeThinker

时间:2026-06-18 23:19:00

  消息,微博团队日前开源了30亿参数的推理模型VibeThinker-3B。该模型在数学与编程等任务上达到前沿水平,部分指标接近或超越DeepSeek v3.2、GLM-5和Gemini 3 Pro等大规模旗舰模型。VibeThinker-3B基于Qwen2.5-Coder-3B改造,采用Spectrum-to-Signal流程进行二次训练,训练全程使用64k大思考空间防止中断推理步骤。研发团队提出「参数压缩-覆盖假设」,认为逻辑推理属于高度可压缩的能力,主要依赖规则和纠错,3B小模型能跑出顶尖效果,但对常识性开放知识的覆盖能力仍弱于大模型。团队强调,研发目的并非用小模型替代大模型,而是探索紧凑型模型在明确验证机制下的能力边界。

热点推荐
1 微博开源VibeThinker

消息,微博团队日前开源了30亿参数的推理模型VibeThinker-3B。该模型在数学与编程等任务上达到...

2 Algorand基金会公布路线图,计划2027年底前

消息,Algorand基金会公布了其路线年底前实现区块链的抗量子攻击能力。该路线年开始的升级,...

3 Michaël van de Poppe:比特币关键支撑位将决

消息,分析师Michal van de Poppe表示,如果比特币能保持在64,000美元以上,未来几周加密市场将会...

4 以色列袭击黎巴嫩南部致3人死亡

以色列国防军无人机当天对黎南部奈拜提耶地区发动多次袭击,造成3人死亡。报道说,以军一...

5 Hive签署2.2亿美元加拿大AI基础设施协议,

消息,Hive Digital Technologies签署了一项价值2.2亿美元的加拿大主权AI基础设施协议,该GPU云合同...

6 美国上周初请失业金人数下降,劳动力市

消息,美国上周初请失业救济人数下降,显示劳动力市场仍处于低裁员状态。美国劳工部周四...

7 微软警告:加密剪贴板恶意软件现已成为

消息,微软威胁情报团队警告,自2026年2月以来,Windows平台上出现了一种加密剪贴板恶意软件...

8 巨鲸在Aster波动中爆仓亏损53.06万美元,重

消息,据Lookonchain监测,巨鲸地址0x5f91在Aster公布代币经济学更新后买入约533万枚Aster,价值约...

9 疑似a16z的12个钱包在过去20小时转入2400万

消息,疑似a16z的12个钱包在过去20个小时里将2400万USDC转入HyperLiquid,目前正在通过时间加权平...

10 纳指100纳入预期提振NBIS日涨10%,某交易员

消息,NBIS在过去24小时上涨约10%。在Hyperliquid上,该合约暂报295.5美元,盘中一度升至298美元,...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。