马上注册,结交更多好友,享用更多功能,更可下载纽约情报站APP哦!
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
总部位于杭州的大陆AI新创公司「深度求索」(DeepSeek),去年底1月20日先后发布了「DeepSeek-V3」和「DeepSeek-R1」两款大模型,由于成本低廉,性能与OpenAI相当,陆媒指此举引发硅谷震惊,甚至引发Meta内部焦虑。 (取自DeepSeek官网)总部位于杭州的中国AI新创公司「深度求索」(DeepSeek),去年底1月20日先后发布了「DeepSeek-V3」和「DeepSeek-R1」两款大模型,由于成本低廉,性能与OpenAI相当,中媒指此举引发硅谷震惊, 甚至引发Meta内部焦虑,工程师开始连夜尝试拷贝DeepSeek的成果。
中媒「每日经济新闻」26日报导,在美国总统川普宣布5000亿美元的「星际之门」(Stargate)发展人工智能基础建设计划之际,DeepSeek以极低的价格创建了突破性的AI模型,且未使用尖端芯片,让人们质疑,AI行业数千亿美元资本的巨额投入,是否真为最有效的方法?
报导回顾,去年12月27日,DeepSeek推出开源模型「DeepSeek-V3」。 AI系统排名网站「聊天机器人竞技场」(Chatbot Arena)显示,「DeepSeek-V3」在所有模型中排名第7,在开源模型排第1。 且「DeepSeek-V3」是全球前十中,性价比最高的模型。
不到1个月,今年1月20日,DeepSeek再推出「DeepSeek-R1」,24日,「DeepSeek-R1」在聊天机器人竞技场综合榜单上排名第3,与顶尖推理模型、OpenAI推出的o1并列。 同时,测评机构「Artificial-Analysis」对「DeepSeek-R1」的初始基准测试结果也显示,「DeepSeek-R1」在AI分析质量指数中取得第2高分,价格则是o1的约30之1。
「每日经济新闻」称,24日,一篇发布在匿名平台teamblind上的文章疯传,一位自称是Meta员工称,Meta内部因为DeepSeek模型进入恐慌模式,该文员工写道,「DeepSeek-V3」在基准测试中,已经让(Meta推出的)Llama 4相形见绌,而更让人难堪的是,一家「仅用550万美元训练预算的中国公司」就做到了这一点。
该匿名文指,工程师正争分夺秒分析DeepSeek,试图拷贝其中的一切可能技术。 另外,「DeepSeek-R1」的出现,也让情况更加严峻。
《金融时报》25日称,中国的小型AI新创公司DeepSeek震惊硅谷,加州大学柏克莱分校AI政策研究员古普塔(Ritwik Gupta)表示,DeepSeek最近发布的模型,表明「AI能力没有护城河」。 古普塔也提到,中国的系统工程师人才库比美国大得多,懂得如何充分利用计算资源,来更便宜地训练、运行模型。 点击下面文字可快速查看或发布对应的便民信息! 纽约情报站让您的生活变的更简单
简介:纽约情报站是汇集全美75万粉丝的公众平台。除了实时新闻、找工招工信息发布、app社区互动,更有微信公众号推文探店等。如果你投稿、爆料、活动策划、商务合作,或者想邀请我们去探店,请联系主编微信: nyinfor
|