开启左侧

[社会] DeepSeek直冲下载榜首 Meta焦虑火速成立四个战情室应敌

[复制链接]
HILOVEYOUTU 发表于 2025-1-27 13:30:13 | 显示全部楼层 |阅读模式 来自: 美国

马上注册,结交更多好友,享用更多功能,更可下载纽约情报站APP哦!

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

                               
登录/注册后可看大图
Meta传出已火速成立四个战情室,因应来势汹汹的大陆新创公司DeepSeek在AI模型方面的竞争。 (路透)
随着中国AI新创公司DeepSeek以较低成本推出高性能AI模型震撼硅谷,脸书母公司Meta的AI研究人员陷入恐慌模式,据传Meta生成式AI团队的主管和工程师已经成立四个「战情室」研究DeepSeek的运作方式。

根据科技新闻网站The Information报导,Meta的AI团队一些主管近日对DeepSeek推出的新型的对话式AI公开表达担忧,担心Meta在AI竞赛中落后了。 两名员工透露,包括AI基础设施总监欧德汉(Mathew Oldham)在内的主管担心,自家旗舰AI模型Llama的下一版本表现可能无法DeepSeek匹敌。

DeepSeek去年底推出大型语言模型「DeepSeek V3」,根据多份美国公司发表的评估和用户评价,这款模型在完成多种任务方面表现,符合或甚至超越三大AI公司Meta、OpenAI和Anthropic的模型; 该公司接着在本月20日推出另一个模型「DeepSeek-R1」,可能媲美OpenAI的o1推理模型,这引发外界质疑美国一些AI公司是否运作效率低,或耗费太多资金却取得较差的成果。

应用程序(App)的开发商能够自由下载DeepSeek或通过基于云端的应用程序接口购买使用权。 一些规模较小的App开发商表示,他们已改用DeepSeek,原因是成本远低于OpenAI或Anthropic模型。

消费者则可通过一款聊天机器人App使用DeepSeek,这会与ChatGPT竞争。 现在,DeepSeek的App在苹果 App Store免费应用程序下载排行榜已经冲上第一名,ChatGPT则落居第三。

The Information报导指出,OpenAI、Meta和其他顶尖开发商的研究人员正仔细分析DeepSeek模型,以寻找可借鉴之处,包括它如何以比一些美国AI模型能以更低成本、更具效率的方式运作。

其中,Meta已为此筹组四个「战情室」。 一名员工透露,两个小组聚焦于研究如何降低训练和运作DeepSeek 的成本。 虽然Meta的模型是免费的,但运作成本比OpenAI的模型更高,部分原因是OpenAI能够通过批量处理消费者数百万次的查找来降低价格; 相较下,使用Llama的小型开发者,则欠缺足够的查找量来以同样的方式降低成本。

员工透露,第三个研究小组正在试图厘清DeepSeek使用了哪些数据来训练其模型; 第四个战情室则是考虑基于DeepSeek模型归纳出的特质,重新建构Meta的模型。 据称,Meta正考虑推出一个类似DeepSeek的Llama版本,包含多个AI模型,每个模型专门训练处理不同的任务。 借此,当消费者要求Llama处理某个任务时,只要让模型的一部分进行运作,这可能让整体模型的运作速度更快,并减少所需的运算资源。

Meta 发言人卡维尔在声明中表示:「我们在开发过程中会定期评估所有竞争模型,而且是从本公司生成式AI团队 成立以来一直如此。」
点击下面文字可快速查看发布对应的便民信息!
纽约情报站让您的生活变的更简单

简介:纽约情报站是汇集全美75万粉丝的公众平台。除了实时新闻、找工招工信息发布、app社区互动,更有微信公众号推文探店等。如果你投稿、爆料、活动策划、商务合作,或者想邀请我们去探店,请联系主编微信: nyinfor

回复

使用道具 举报

全部回复0 显示全部楼层

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

楼主

情报站神秘人
联系客服 关注微信 下载APP 返回顶部 返回列表