开启左侧

[国内] 阿里云发表通义千问旗舰版 宣称全面超越DeepSeek

[复制链接]
HILOVEYOUTU 发表于 2025-1-29 13:40:52 | 显示全部楼层 |阅读模式 来自: 美国

马上注册,结交更多好友,享用更多功能,更可下载纽约情报站APP哦!

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

                               
登录/注册后可看大图
阿里云发表通义千问旗舰版Qwen2.5-Max,宣称全面超越DeepSeek。 (量子位微信公众号)
阿里云在大年初一发布通义千问旗舰版模型Qwen2.5-Max,并宣称在指令模型版本性能测试中,几乎全面超越深度求索DeepSeek-V3等其他模型。

阿里云1月29日凌晨在微信公众号宣布,Qwen2.5-Max全新升级发布,并说新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源混合专家(MoE)模型以及最大的开源稠密模型。

阿里云说,通义团队分别对Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能进行了评估测试。

在指令模型方面,Qwen2.5-Max在多个基准测试中比肩美国的Claude-3.5-Sonnet模型,几乎全面超越了另外三个美国模型GPT-4o、DeepSeek-V3及Llama-3.1-405B。

在基座模型方面,阿里云则说,通义团队将Qwen2.5-Max与目前领先的开源MoE模型DeepSeek V3、最大的开源稠密模型Llama-3.1-405B,以及同样位列开源稠密模型前列的Qwen2.5-72B进行了对比。 在所有11项基准测试中,Qwen2.5-Max全部超越了对比模型。

另据路透社报导,选择大年初一发布Qwen 2.5-Max是较为特殊的时间点,也显示了深度求索过去三周迅速崛起,给中国境内外竞争对手带来压力。

深度求索1月20日发布推理模型DeepSeek-R1后,字节跳动旗下豆包更新版大模型1.5-pro上星期三(22日)正式发布。

根据IT之家报导,1.5-pro模型增强了综合能力,在知识、代码、推理、中文等多个评测基准上,综合得分优于GPT-4o、Claude 3.5 Sonnet 等模型。
点击下面文字可快速查看发布对应的便民信息!
纽约情报站让您的生活变的更简单

简介:纽约情报站是汇集全美75万粉丝的公众平台。除了实时新闻、找工招工信息发布、app社区互动,更有微信公众号推文探店等。如果你投稿、爆料、活动策划、商务合作,或者想邀请我们去探店,请联系主编微信: nyinfor

回复

使用道具 举报

全部回复0 显示全部楼层

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

楼主

情报站神秘人
联系客服 关注微信 下载APP 返回顶部 返回列表