当前位置:主页 > 热点 >

RL微调让4B模型金融问答超越235B:Snorkel AI开源FinQA训练环境

时间:2026-03-31 14:12:47

  消息,据 1M AI News 监测,Snorkel AI 发布 FinQA,一个基于线-K 财务文件构建的强化学习训练环境,现已开源于 Meta PyTorch 与 Hugging Face 联合维护的 OpenEnv 平台。FinQA 覆盖 22 家上市公司的 290 道专家标注财务问答,向 Agent 提供 4 个 MCP 工具:列出可用财务表、获取表结构、执行 SQL 查询、提交答案。SQL 强制要求过滤条件且禁止 `SELECT *`,迫使 Agent 只取所需数据,而非倾倒整张表。Snorkel AI 与加州大学伯克利分校 rLLM 团队合作,用 FinQA 对 Qwen3-4B 进行强化学习微调,结果在金融问答基准 SnorkelFinance 上得分 59.7%,超过同系列 Qwen3-235B,参数量约为后者的 1/60,推理成本降约 90%。关键发现:大模型能推理,但会产生幻觉列名、无视 SQL 约束;RL 训练后的小模型反而能精准调用工具,「工具纪律」而非规模才是瓶颈。FinQA 是 Snorkel AI 在 OpenEnv 发布的首个开源环境,后续将推出覆盖医疗、保险、法律等行业的多轮次企业环境。

热点推荐
1 880 BTC从Coinbase Institutional转移至未知钱包

消息,据Whale Alert监测,880枚BTC刚刚从Coinbase Institutional转移至一个未知钱包。...

2 超55万枚比特币流入Binance与OKX,创2023年以

消息,据CryptoQuant分析师Darkfost表示,随着比特币跌破6万美元,超过22万枚比特币流入Binance热钱...

3 Claude Code之父介绍未来五大研发角色

消息,Claude Code之父Boris Cherny指出,传统程序员与设计师的分工正被AI瓦解,未来的产品研发将...

4 周末资金在链上抢跑周一开盘已成常态,

消息,周末资金在链上抢跑周一开盘已成常态,近期Trade.xyz周日成交量较周六均高出60%以上。...

5 比特币处于关键技术位,若跌破6万美元或

Miller Tabak策略师Matt Maley和22V Research技术策略师John Roque认为,比特币目前处于关键技术指标位。...

6 Hyperliquid巨鲸:DRAM指数高杠杆巨鲸距清算

消息,反映内存现货价格的DRAM指数随韩国存储抛售外溢而高位回调,4小时跌约6%,现报70.68美...

7 XBIT DEX:Trinity Tatum赢得《爱岛美国》第八

消息,预测市场显示,Trinity Tatum在赢得《爱岛美国》第八季的赔率中飙升,目前概率为90%。...

8 韩国修订上市规则,部分加密财库上市公

韩国修订后的上市规则将于7月1日生效,上市门槛提高。受比特币价格下跌和KOSDAQ市场资金外流...

9 CZ:接入主站流动性,明确不会再次执掌

消息,据Coindesk专访,Binance创始人CZ将2026年加密熊市归因于资金向AI领域转移、地缘政治紧张局...

10 DeFi黑客攻击损失达9.42亿美元,TVL大幅下

2026年DeFi平台遭遇121起黑客攻击,损失金额约为9.42亿美元。仅在第二季度,就发生了85起攻击,...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。