当前位置:主页 > 要闻 >

微软开源嵌入模型Harrier,多语言MTEB榜单登顶,大幅领先OpenAI和谷歌

时间:2026-04-08 10:44:26

  消息,微软必应团队开源了嵌入模型系列 Harrier。嵌入模型是搜索引擎和 RAG 系统的底层组件,负责将文本转换为向量以便检索和匹配,它的质量直接决定了 AI 系统能否找到正确的信息。旗舰版 Harrier-OSS-v1-27B 在多语言 MTEB v2 基准上均分 74.3,超出此前开源模型最高分 2 个百分点,排名第一。与闭源模型对比,领先幅度更大:OpenAI text-embedding-3-large 均分 58.92,谷歌 Gemini Embedding 2 为 69.9,亚马逊 Titan Embed v2 为 60.37。同步开源两个轻量版本供低算力场景部署:1. 0.6B 参数版:均分 69.0,榜单第 10,已超过谷歌 Gemini Embedding 12. 270M 参数版:均分 66.5,榜单第 15,以最小体量超过 OpenAI 和亚马逊闭源模型三个版本均支持超过 100 种语言和 32K 上下文窗口。训练数据包括超过 20 亿条弱监督文本对和 1000 万条高质量样本,合成数据由 GPT-5 生成。旗舰模型完成后还作为教师模型,通过知识蒸馏提升两个小模型的性能。微软表示 Harrier 的技术将整合进必应搜索和新一代 Agent 接地服务中。

热点推荐
1 哈塞特:美伊潜在协议或致能源价格大幅

消息,美国白宫国家经济委员会主任哈塞特表示,若美伊达成潜在协议,可能导致能源价格大...

2 美伊协议草案包括在黎巴嫩结束敌对行动

美国消息人士谈及黎巴嫩时表示,美伊协议草案包含与5月15日停火条款相同的内容,具体包括...

3 黎巴嫩真主党领导人呼吁放弃与以色列的

消息,黎巴嫩真主党领导人纳伊姆卡西姆再次敦促黎巴嫩当局放弃与以色列的直接谈判,称此...

4 伊朗外交部谴责奎达铁路站恐怖袭击

消息,伊朗外交部发言人强烈谴责发生在奎达铁路站的恐怖袭击行为,该事件已导致大量巴基...

5 重仓布局三大市场:NEAR空单新开仓399,1

消息,巨鲸在HyperLiquid平台新开NEAR空单,建仓量为399,140枚,开仓价为3.29美元,目前币价为2....

6 Keyrock报告:AI代理支付市场正在形成

消息,Keyrock的一份新报告指出,人工智能代理开始使用加密货币进行支付,尽管这一市场仍然...

7 币界晚讯 比特币ETF单周流出12亿美元,创

5月24日消息: 1. 比特币ETF单周流出12亿美元,创2026年第三大负面周; 2. Stablr:欧元和美元稳定...

8 俄罗斯国防部:对乌克兰打击仅针对军事

消息,俄罗斯国防部于5月24日表示,俄军当天动用榛树伊斯坎德尔匕首锆石等多型导弹及攻击...

9 霍斯金森启动对11000个DAO的治理审查

消息,Cardano创始人查尔斯霍斯金森已开始对超过11000个去中心化自治组织进行广泛审查,讨论...

10 Hype过去24小时爆仓超1300万美元,最大单笔

消息,据数据显示,过去24小时Hype爆仓达1323.1万美元,其中空单爆仓1175.64万美元,多单爆仓...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。