开启左侧

[社会] DeepSeek劲敌? 阿里发布新开源模型QwQ-32B家用显卡就能跑

[复制链接]
HILOVEYOUTU 发表于 6 小时前 | 显示全部楼层 |阅读模式 来自: 美国

马上注册,结交更多好友,享用更多功能,更可下载纽约情报站APP哦!

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

                               
登录/注册后可看大图
阿里巴巴AI To C业务旗下AI应用「阿里通义」6日发布最新的开源推理模型通义千问QwQ-32B。 (取材自快科技)
阿里巴巴AI To C业务旗下AI应用「阿里通义」在6日正式发布最新的开源推理模型通义千问QwQ-32B,其官方介绍称,透过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上进步飞跃,整体性能比肩DeepSeek-R1,同时大幅降低部署使用成本,在消费级显卡上能实现本地部署。

用户已可免费下载及商用QwQ-32B模型,或透过网页版Qwen Chat体验,该模型也将免费上架通义App。

阿里通义团队表示,QwQ-32B模型针对数学和编程任务、通用能力分别进行2轮大规模强化学习,在32B的模型尺寸上获得推理能力提升,印证了大规模强化学习(Reinforcement Learning,一种机器学习技术)可显著提高模型性能。

该团队指,千问QwQ-32B能提供极强的推理能力,以及满足更低的资源消耗需求,背后关键在于强化学习。 该团队表示,希望能够证明强大的基础模型叠加大规模强化学习,也许是一条通往通用人工智能(AGI)的可行之路。

此外,QwQ-32B模型中还集成了与智能体(AI Agent,指的是能够自主做出决策、完成行动,且毋需人类介入的人工智能)相关的能力,能在使用工具的同时进行批判性思考,以及根据环境反馈调整推理过程。

受此消息影响,6日阿里巴巴集团港股早盘大幅高开涨逾6%,截至午盘涨逾7%。
点击下面文字可快速查看发布对应的便民信息!
纽约情报站让您的生活变的更简单

简介:纽约情报站是汇集全美75万粉丝的公众平台。除了实时新闻、找工招工信息发布、app社区互动,更有微信公众号推文探店等。如果你投稿、爆料、活动策划、商务合作,或者想邀请我们去探店,请联系主编微信: nyinfor

回复

使用道具 举报

全部回复0 显示全部楼层

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

楼主

情报站神秘人
联系客服 关注微信 下载APP 返回顶部 返回列表