当前位置:主页 > 热点 >

阿里云通义千问Qwen2.5-Max登顶AI大模型榜单

时间:2025-02-06 22:16:10

  阿里云近日公布了其全新的通义千问Qwen 2.5-Max超大规模MoE模型,并宣布在多个基准测试中超越DeepSeek V3等竞争对手。阿里云表示,Qwen2.5-Max在Chatbot Arena大模型盲测中,以1332分位列全球第七名,成为非推理类的中国大模型冠军。

  Qwen2.5-Max在数学和编程等单项能力上排名第一,在硬提示(Hard prompts)方面排名第二。这一成绩展示了阿里云在AI技术领域的领先地位。

  据公开资料显示,Chatbot Arena是由LMSYS Org推出的大模型性能测试平台,目前集成了190多种模型。该榜单采用匿名方式将大模型两两组队,交给用户进行盲测,用户根据真实对话体验对模型能力进行投票。因此,Chatbot Arena LLM Leaderboard成为业界公认的最公正、最权威榜单之一,也是全球顶级大模型的最重要竞技场。

  阿里云表示,在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等主流基准测试中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。

热点推荐
1 知名交易员Loracle增持SOL多单12936.49枚

消息,知名交易员Loracle增持SOL多单12,936.49枚,约合901,287.47美元。当前持仓规模为5,663,915.74美元...

2 Etched完成8亿美元融资,锁定逾10亿美元订

消息,AI硬件公司Etched完成8亿美元融资,并已锁定超过10亿美元的推理集群订单。Etched正在打造...

3 ETH 2026年Q2收盘下跌25.2%,首次连续三个季

消息,据cryptorank数据显示,ETH在2026年第二季度收盘下跌25.2%,这是历史上首次出现连续三个季...

4 sovright推出Argos钱包恢复工具,帮助早期

消息,Zcash新非营利组织sovright推出名为Argos的钱包恢复工具,旨在帮助早期Zcash用户恢复因旧版...

5 Cathie Wood:AI与新技术正驱动生产力提升,

消息,ARK Invest创始人Cathie Wood表示,当前宏观数据削弱了通胀担忧,经济正处于由生产力提升...

6 Bitget推出加密交易者传统金融101学习系列

消息,Bitget宣布推出针对加密交易者的传统金融101学习系列,该系列旨在解释传统金融体系,...

7 疑似HYPE上币内幕「 HYPE 多仓 TOP 1」:HY

消息,HYPE多单浮盈收窄,目前盈亏约为3607万美元,均价为38.68美元,当前币价为64.81美元,清...

8 欧盟MICA截止日期临近,迪拜吸引加密公司

欧盟的MICA截止日期迫使未获许可的公司从7月1日起停止为欧盟客户。一位迪拜律师向CoinDesk表示...

9 分析师:密歇根法院暂时禁止Kalshi提供体

消息,密歇根州法院暂时禁止Kalshi向该州居民提供体育赛事合约,进一步升级了对联邦监管预...

10 Solana价格因代币化股票热潮上涨18%

消息,Solana价格在过去一周上涨近18%,受代币化股票活动创纪录和机构采用增加的推动。Sola...

成都来彰科技 蜀ICP备2025134723号-1

资讯来源互联网,如有版权问题请联系管理员删除。