当前位置:主页 > 要闻 >

微软开源嵌入模型Harrier,多语言MTEB榜单登顶,大幅领先OpenAI和谷歌

时间:2026-04-08 10:44:26

  消息,微软必应团队开源了嵌入模型系列 Harrier。嵌入模型是搜索引擎和 RAG 系统的底层组件,负责将文本转换为向量以便检索和匹配,它的质量直接决定了 AI 系统能否找到正确的信息。旗舰版 Harrier-OSS-v1-27B 在多语言 MTEB v2 基准上均分 74.3,超出此前开源模型最高分 2 个百分点,排名第一。与闭源模型对比,领先幅度更大:OpenAI text-embedding-3-large 均分 58.92,谷歌 Gemini Embedding 2 为 69.9,亚马逊 Titan Embed v2 为 60.37。同步开源两个轻量版本供低算力场景部署:1. 0.6B 参数版:均分 69.0,榜单第 10,已超过谷歌 Gemini Embedding 12. 270M 参数版:均分 66.5,榜单第 15,以最小体量超过 OpenAI 和亚马逊闭源模型三个版本均支持超过 100 种语言和 32K 上下文窗口。训练数据包括超过 20 亿条弱监督文本对和 1000 万条高质量样本,合成数据由 GPT-5 生成。旗舰模型完成后还作为教师模型,通过知识蒸馏提升两个小模型的性能。微软表示 Harrier 的技术将整合进必应搜索和新一代 Agent 接地服务中。

热点推荐
1 某地址向币安充值1798万美元WBTC

消息,据Ai 姨发推称:某地址向币安充值 264.445 枚 WBTC,价值约 1798 万美元。该地址的 WBTC 建仓...

2 首个浏览器“龙虾”QBotClaw正式上线

4月8日讯,腾讯云消息,首个浏览器龙虾QBotClaw,正式上线了。它不仅完全兼容OpenClaw技能,还...

3 微软开源嵌入模型Harrier,多语言MTEB榜单

消息,微软必应团队开源了嵌入模型系列 Harrier。嵌入模型是搜索引擎和 RAG 系统的底层组件,...

4 MEXC 跟单新增 PUMPCADE 和 ADI U本位合约交易

消息,MEXC 跟单新增 PUMPCADEUSDT 和 ADIUSDT 两个合约交易对,均支持最高 20 倍杠杆,用户可跟随资...

5 美媒:停火期间伊朗和阿曼将征收海峡“

4月8日讯,一位地区官员透露,为期两周的停火计划包括允许伊朗和阿曼对通过霍尔木兹海峡的...

6 巨鲸提前卖出264.4枚WBTC错失百万美元

消息,据链上分析师余烬发推称:一位 DeFi 巨鲸在美伊停火提议达成前,以约 1798 万美元的价...

7 实时行情早报:SOL索拉纳价格突破86.59美

XBIT Wallet数据来源,索拉纳solana今日价格行情,SOL索拉纳最新价格突破至$86.59,涨幅达3.59%,交...

8 现货黄金突破4840美元,日内涨幅达2.25%

消息,根据数据,现货黄金突破4840美元,现报4840.27美元,日内涨幅达2.25%,最高触及4851.21美元...

9 以太坊回升突破2200美元

消息,4 月 8 日,据 HTX 行情数据,以太坊回升突破 2200 美元,24 小时涨幅 5.36%。...

10 美媒:伊朗切断与美国的直接外交沟通

消息,中东地区官员表示,由于特朗普早间威胁要摧毁伊朗整个文明,伊朗已切断与美国的直...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。