开启左侧

[社会] DeepSeek除夕发布文生图大模型 表现优于OpenAI

[复制链接]
HILOVEYOUTU 发表于 2025-1-28 13:34:04 | 显示全部楼层 |阅读模式 来自: 美国

马上注册,结交更多好友,享用更多功能,更可下载纽约情报站APP哦!

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

                               
登录/注册后可看大图
继开源大语言模型DeepSeek-R1后,来自杭州的初创企业深度求索1月28日除夕再发布开源多模态模型Janus-Pro 7B。 (路透)
中国新创企业DeepSeek(深度求索)公布低成本大模型后,除夕(1月28日)再发布开源文本生成图像(文生图)大模型Janus-Pro 7B,该模型在基准测试中超越美国巨头OpenAI

综合路透报导和GitHub消息,这款开源多模态模型被设计为高效且多功能的模型,擅长生成逼真图像、运行复杂视觉推理等多种视觉任务。

DeepSeek自称,Janus-Pro在使用文本提示生成图像的基准测试中,表现优于OpenAI的DALL-E 3和Stability AI的Stable Diffusion。

DeepSeek公众号说,这款大模型是2024年11月13日发布的JanusFlow大模型的高端版本。 新模型通过改进训练流程、数据质量和模型规模,提升图像生成的稳定性和细节表现。

DeepSeek解释道,Janus-Pro通过增加7200万张高质量的合成图像,并与真实数据进行平衡,进一步提高视觉效果的吸引力和图像输出的稳定性; 新款模型版本拥有高达70亿个参数,在文本生成图像的速度和准确性及任务理解能力方面取得显著提升。

DeepSeek1月20日发布开源大语言模型DeepSeek-R1,凭借低训练成本,却能比拟OpenAI的o1模型的高性能引发全球科技圈关注,更促使投资者抛售全球科技股。 此举冲击美股,辉达市值蒸发近6000亿美元。

美国科技博客网站VentureBeat报导指出,与一些规模最大、资源最密集的模型不同,拥有70亿参数的Janus-Pro无需庞大的计算资源即可提供高水平的性能,这可能大大降低企业采用先进视觉AI的门槛,对初创公司或跨国企业来说具有极大吸引力。

此外,在Janus-Pro模型的开源性质下,企业无需受限于供应商绑定或支付高额费用,就能使用前沿AI技术。 这对AI巨头构成直接威胁:他们的专有高价模型能否在免费、高质量的替代品面前生存? 市场的抛售表明投资者对此表示怀疑。

VentureBeat认为,DeepSeek选择在美国科技股暴跌之际发布Janus-Pro,这一时机显然经过精心设计,意在突显这家初创企业对硅谷的挑战,且具备颠覆AI领域既有秩序的能力。
点击下面文字可快速查看发布对应的便民信息!
纽约情报站让您的生活变的更简单

简介:纽约情报站是汇集全美75万粉丝的公众平台。除了实时新闻、找工招工信息发布、app社区互动,更有微信公众号推文探店等。如果你投稿、爆料、活动策划、商务合作,或者想邀请我们去探店,请联系主编微信: nyinfor


回复

使用道具 举报

全部回复0 显示全部楼层

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

楼主

情报站神秘人
联系客服 关注微信 下载APP 返回顶部 返回列表