pg电子新闻中心
“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷巨头进入恐慌模式外媒刷屏大佬发声:中国AI已追上美国园林景观设计公司
1月20日,中国AI初创公司深度求索开源R1推理模型,其在多项测试中表现出色,引发外媒集体刷屏,为硅谷敲响警钟。此前,DeepSeek-V3已开源。两款模型成本低廉,性能与OpenAI相当,让硅谷震惊。Meta内部因DeepSeek的模型进入恐慌模式,试图复制。AI大佬惊叹,中国AI已追上美国,或彻底改变游戏规则。
短短一个月内,中国AI初创公司深度求索(DeepSeek)先后发布了DeepSeek-V3和DeepSeek-R1两款大模型,成本价格低廉,性能与OpenAI相当,让硅谷震惊,甚至引发了Meta内部的恐慌园林景观设计公司,工程师们开始连夜尝试复制DeepSeek的成果。
Scale AI创始人Alexander Wang在1月24日的采访中表示,DeepSeek在他们的测试里是表现最好的,与美国最好的模型相当。
此前,Alexander Wang评价说,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”
此外,中国AI“刷屏”国外各大媒体,它们认为中国大模型的新进展为硅谷敲响了警钟。
在5000亿美元的“星际之门”计划公布之际,DeepSeek以极低的价格建立了一个突破性的AI模型,而且没有使用尖端芯片,让人们质疑,AI行业数千亿美元资本的巨额投入真的是最有效的方法吗?
1月24号,一条发布在匿名平台teamblind上的帖子疯传。一名Meta员工称,现在Meta内部因为DeepSeek的模型,已经进入恐慌模式。
“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,一家仅用550万美元训练预算的中国公司就做到了这一点。
工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术。这绝非夸张。
管理层正为GenAI研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本,而且这样的高管还有数十位,他们该如何向高层交代?
DeepSeek-R1的出现让情况更加严峻。具体细节属于机密,不便透露,不过很快就会公开了。”
去年12月27日,DeepSeek推出开源模型DeepSeek-V3。当时,聊天机器人竞技场(Chatbot Arena)显示,DeepSeek-V3在所有模型中排名第七,在开源模型排第一。而且,DeepSeek-V3是全球前十中性价比最高的模型。
不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型,允许所有人在遵循MIT License(注:被广泛使用的一种软件许可条款)的情况下,蒸馏R1训练其他模型。
1月24日,DeepSeek-R1在聊天机器人竞技场综合榜单上排名第三,与顶尖推理模型o1并列。
在高难度提示词、代码和数学等技术性极强的领域,DeepSeek-R1拔得头筹,位列第一。
在风格控制方面,DeepSeek-R1与o1并列第一园林景观设计公司,意味着模型在理解和遵循用户指令,并按照特定风格生成内容方面表现出色。
在高难度提示词与风格控制结合的测试中,DeepSeek-R1与o1也并列第一,进一步证明了其在复杂任务和精细化控制方面的强大能力。
去年12月DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就发贴称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”
著名投资公司A16z的创始人马克安德森1月24日发文称,Deepseek-R1是他见过的最令人惊叹、最令人印象深刻的突破之一,而且还是开源的,它是给世界的一份礼物。
1月24日,A16z合伙人、Mistral AI董事会成员Anjney Midha表示:“从斯坦福到麻省理工,DeepSeek-R1几乎一夜之间成为美国顶尖大学研究人员的首选模型。”
对于中国AI为何能有如此快速的进展,诺奖得主、“AI教父”杰弗里辛顿在1月21日接受博主Curt Jaimungal专访中表示,中国的STEM(科学、技术、工程、数学)教育比美国更好,拥有更多受过良好教育的人才,这将为AI的发展提供坚实的基础。尽管美国试图通过限制(如英伟达芯片)来减缓中国的发展,但这只会促使中国加速发展自己的技术,“他们可能会落后几年,但最终会赶上”。
斯坦福大学和Epoch AI的研究人员去年年中发表了一项研究表明,到2027年,最大型的模型的训练成本将超过10亿美元。Gartner预测,到2028年Google、Microsoft和AWS等超大规模企业仅在AI服务器上的支出就将高达5000亿美元。
但DeepSeek完全不同,它的训练成本并不昂贵。Noahs Arc资本管理公司表示,DeepSeek-V3模型有可能彻底改变训练和推理领域的游戏规则。
特别是在5000亿美元的“星际之门”计划公布后,DeepSeek更让人怀疑,巨额投入这种“大力出奇迹”的办法真是最有效的方法吗?
美股大V“THE SHORT BEAR”1月24日在X上发文称,DeepSeek给AI巨头们带来了痛苦时刻,投资者必须对此敲响警钟。
他说:“如果击败OpenAI只需要5500万美元,那么这个行业的商业化会比很多人预想的要快很多。”
他还指出:“根据红杉,美国AI公司每年必须产生约6000亿美元收入来支付其AI硬件费用。现在看来,这种冒险行为变得越来越无利可图。”
著名财经记者Holger Zschaepitz 1月25日表示,DeepSeek以极低的价格建立了一个突破性的AI模型,而且没有使用尖端芯片,这让人们质疑该行业数千亿美元资本支出的效用。
值得注意的是,DeepSeek-V3发布后,英伟达股价下跌了2%。而DeepSeek-R1引发海外大讨论后,1月24日英伟达股价又大跌了3.12%。
如果说DeepSeek-V3只是掀起了波澜,那么DeepSeek-R1则是引发了轰动。最近四天,国外媒体纷纷聚焦DeepSeek,并一致认为中国大模型的新进展为硅谷敲响了警钟。
1月22日,美国媒体Business Insider报道称,DeepSeek-R1模型秉承开放精神,完全开源,为美国AI玩家带来了麻烦。开源的先进AI可能挑战那些试图通过出售技术赚取巨额利润的公司。
1月24日,美国媒体CNBC推出了长达40分钟的节目,邀请了Perplexity CEO Aravind Srinivas来分析为何DeepSeek会引发人们对美国在AI领域的全球领先地位是否正在缩小的担忧。
英国《金融时报》1月25日报道称,中国小型AI初创公司DeepSeek震惊硅谷。报道聚焦资源更丰富的美国AI公司能否捍卫自己的技术优势。
报道援引加州大学伯克利分校AI政策研究员Ritwik Gupta称,DeepSeek最近发布的模型表明“AI能力没有护城河”。Gupta补充说,中国的系统工程师人才库比美国大得多,他们懂得如何充分利用计算资源来更便宜地训练和运行模型。园林景观设计公司
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。
如需转载请与《每日经济新闻》报社联系。未经《每日经济新闻》报社授权,严禁转载或镜像,违者必究。
特别提醒:如果我们使用了您的图片,请作者与本站联系索取稿酬。如您不希望作品出现在本站,可联系我们要求撤下您的作品。
近日,中国AI初创公司深度求索(DeepSeek)的DeepSeek-V3和DeepSeek-R1两款大模型在国外“刷屏”。各大媒体纷纷表示,中国大模型的新进展为硅谷敲响了警钟。 更有Meta员工表示,DeepSeek的大模型已经让Meta进入了恐慌模式,工程师们在连夜尝试复制DeepSeek的成果。 多位AI界的大佬都一致认为,中国在AI领域已经赶上美国了。AI数据服务公司Scale AI创始人Alexander Wang在DeepSeek-V3发布后就发贴称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。” 在5000亿美元的“星际之门”计划公布之际,DeepSeek以极低的价格建立了一个突破性的AI模型,而且没有使用尖端芯片,让人们质疑,AI行业数千亿美元资本的巨额投入真的是最有效的方法吗? 外媒集体刷屏:中国小型AI初创公司震惊硅谷 DeepSeek发布的两款大模型DeepSeek-V3和DeepSeek-R1在国外媒体中“刷屏”。各大媒体纷纷表示,中国大模型的新进展为硅谷敲响了警钟。 美国媒体CNBC报道称,DeepSeek模型正在威胁美国的主导地位。DeepSeek-V3仅用两个月的时间和不到600万美元就构建完成,尽管成本低,但性能却可以超越美国最好的模型。 DeepSeek并不是唯一一家取得进展的中国公司。知名计算机科学家李开复的初创公司01.ai的训练仅花费了300万美元。字节跳动周三也更新了模型doubao 1.5pro,声称在一项关键基准测试中超越了OpenAI的o1。 英国《金融时报》则称,中国小型AI初创公司DeepSeek震惊硅谷。报道说,DeepSeek-R1模型的发布在硅谷引发了一场激烈的争论,焦点是资源更丰富的美国AI公司(包括Meta和Anthropic)能否捍卫自己的技术优势。 报道援引加州大学伯克利分校AI政策研究员Ritwik Gupta的说法:DeepSeek最近发布的模型表明“AI能力没有护城河”。Gupta补充说,中国的系统工程师人才库比美国大得多,他们懂得如何充分利用计算资源来更便宜地训练和运行模型。 《》的题目则是“中国AI初创公司DeepSeek如何与硅谷巨头竞争”。报道说,圣诞节后的第二天,DeepSeek推出了一款新的AI(指的是V3),其功能可与OpenAI和谷歌等公司的尖端聊天机器人相媲美。仅此一点就已经是一个里程碑。 并且,DeepSeek的工程师只使用了很少的芯片。这颠覆了只有科技巨头(它们都位于美国)才能制造出最先进的AI系统的普遍观念。 此外,DeepSeek已经开源了其最新的AI系统。“开源社区的重心已经转移到中国,”加州大学伯克利分校计算机科学教授伊昂·斯托伊卡(Ion Stoica)说。 《自然》杂志表示,价格低廉且开放的AI模型DeepSeek让科学家们兴奋不已。DeepSeek-R1的初步测试表明,它在化学、数学和编码的某些任务上的表现与OpenAI的推理模型o1相当。 德国埃尔朗根马克斯普朗克光科学研究所AI科学家实验室负责人Mario Krenn表示,开放性让R1脱颖而出。相比之下,OpenAI开发的o1和其他模型,包括其最新成果o3,“本质上都是黑匣子”。 DeepSeek尚未公布训练R1的全部成本,但它向用户收取的费用约为o1运行成本的三十分之一。该公司还创建了R1的迷你“精简”版本。“使用o1进行的实验花费超过300英镑,而使用R1则花费不到10美元,”Krenn说,“这是一个巨大的差异,肯定会对其未来产生影响。” 美国媒体Business Insider认为,DeepSeek-R1模型秉承开放精神,完全开源,为美国AI玩家带来了麻烦,它表明中国AI可以与一些顶级AI模型相媲美,并跟上硅谷的尖端发展。其次,开源高度先进的AI也可能挑战那些试图通过出售技术赚取巨额利润的公司。 DeepSeek让Meta进入恐慌模式 硅谷的科技巨头也坐不住了。1月24日园林景观设计公司,一条发布在匿名平台teamblind上的帖子疯传。一名Meta员工称,现在Meta内部因为DeepSeek的模型已经进入恐慌模式了。虽然是匿名平台,但teamblind需要用户验证邮箱,所以员工身份的真实性是可以保障的。 帖子全文如下: “一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,一家「仅用550万美元训练预算的中国公司」就做到了这一点。 工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术。这绝非夸张。 管理层正为GenAI研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个DeepSeek-V3的成本,而且这样的高管还有数十位,他们该如何向高层交代? DeepSeek-R1的出现让情况更加严峻。具体细节属于机密,不便透露,不过很快就会公开了。” 不只是Meta,整个硅谷都被DeepSeek震撼到了。 著名投资公司A16z的创始人马克·安德森表示,Deepseek-R1是他见过的最令人惊叹、最令人印象深刻的突破之一,而且还是开源的,它是给世界的一份深刻的礼物。 A16z合伙人、Mistral AI董事会成员Anjney Midha表示:“从斯坦福到麻省理工,DeepSeek-R1几乎一夜之间成为美国顶尖大学研究人员的首选模型。” AI数据服务公司Scale AI创始人Alexander Wang则在DeepSeek-V3发布后就发贴称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。” 22日,他在公司官网上刊登了一封给特朗普的题为《美国必须赢得人工智能战争》的公开信。信中称:“2023年,中国的AI模型落后了一年多,但现在情况已不再如此。仅在过去的一个月里,我们就看到中国的AI能力相对于我们取得了非常强大的进步。” 而在最新的采访里,Alexander Wang表示DeepSeek在他们的测试里是表现最好的,或者大致与美国最好的模型相当。 Alexandr Wang认为,过去十年来,美国在AI竞赛中领先于中国,但DeepSeek在圣诞节发布的模型带有一种象征意义。 AI大佬纷纷发声:中国AI已追上美国 谷歌前CEO埃里克·施密特去年年初还认为,中国AI还落后于美国两到三年的距离。但最近他就改口了,在最新的采访中,施密特表示,中国AI现在已经完全追上了美国的AI水平。 诺奖得主、“AI教父”杰弗里·辛顿在最新的专访中也表示,尽管中国尚未完全赶上美国,但已经非常接近。 辛顿强调,中国的STEM(科学“Science”、技术“Technology”、工程“Engineering”、数学“Mathematics”)教育比美国更好,拥有更多受过良好教育的人才,这将为AI的发展提供坚实的基础。 辛顿认为,尽管美国试图通过限制(如英伟达芯片)来减缓中国的发展,但这只会促使中国加速发展自己的技术,“他们可能会落后几年,但最终会赶上”。 Perplexity CEO Aravind Srinivas在接受采访时也表示,美国的封锁政策只会让中国公司追求更便宜、更有效率的解决方案,最后来超越美国,因为需求是发明之母。 “DeepSeek可能彻底改变游戏规则” 1月24日,DeepSeek-R1在LM Arena大模型竞技场排行出炉,综合榜单上排名第三,与顶尖推理模型o1并列。 在Hard Prompts(高难度提示词)、 Coding(代码能力)和 Math(数学能力)等技术性极强的领域,DeepSeek-R1更是拔得头筹,位列第一。 在 Style Control(风格控制) 方面,DeepSeek-R1与o1并列第一,意味着模型在理解和遵循用户指令,并按照特定风格生成内容方面表现出色推文还指出, 在Hard Prompt with Style Control(高难度提示词与风格控制结合)的测试中,DeepSeek-R1与o1并列第一,进一步证明了其在复杂任务和精细化控制方面的强大能力。 Artificial-Analysis对DeepSeek-R1的初始基准测试结果显示,DeepSeek-R1在AI分析质量指数中取得第二高分。 斯坦福大学和Epoch AI的研究人员去年年中发表了一项研究表明,在过去八年中,训练前沿AI模型的成本每年增长了两到三倍。他们预计,到2027年,最大的模型的训练成本将超过10亿美元。 然而,Apple的机器学习研究员Awni Hannun表示,DeepSeek-R1的一个关键优势是,它不那么耗资源。Noahs Arc资本管理公司表示,DeepSeek-V3模型有可能彻底改变训练和推理领域的游戏规则。 DeepSeek在资源受限的情况下开发出多种方法来节省计算资源。 比如,DeepSeek-V3模型应用了DeepSeek自主研发的多头潜在注意力(MLA)机制,极大地降低了缓存使用。 在DeepSeek-R1模型上,DeepSeek又开发了一种名为GRPO(组相对策略优化)的新优化方法,有效减少了内存使用,并且这种方法特别适用于在GPU性能较差的情况下进行模型优化。 从本质上讲,DeepSeek的突破将使AI实验室能够大幅度减少生成强大的大语言模型所需的计算量。由于需要的尖端计算更少,他们将能够优化成本。例如,R1的成本最终降到了o1的大约三十分之一。R1的百万token输出只需16元人民币,相较而言,o1的百万token输出需要60美元(约合人民币436元)。 由于规模巨大,Google、Microsoft和AWS等超大规模企业都对成本极为敏感。Gartner预测,到2028年,这些超大规模企业仅在AI服务器上的支出就将高达5000亿美元。因此,他们的重点将始终放在如何降低运营成本上,包括硬件费用以及能源消耗和处理效率。 著名财经记者Holger Zschaepitz表示,DeepSeek以极低的价格建立一个突破性的AI模型,而且没有使用尖端芯片,这让人们质疑该行业数千亿美元资本支出的效用。 特别是在5000亿美元的“星际之门”计划公布后,DeepSeek更让人怀疑,园林景观设计公司巨额的投入真的是最有效的方法吗? 有投资者甚至认为,美股芯片股的股价会面临挑战。 投资者Geiger Capital表示,Deepseek和OpenAI一样好,甚至更好,而且价格只有后者的3%……他们用了2个月的时间,花费不到600万美元,使用性能低下的芯片,而美国公司却投入了数千亿美元。那么……纳斯达克会怎样呢? 值得注意的是,DeepSeek-V3发布后,英伟达股价下跌了2%。而昨天DeepSeek-R1引发海外大讨论后,英伟达股价又大跌了3.12%。 免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。
刷屏的DeepSeek-V3能力到底如何?国外评测报告:超越迄今为止所有开源模型!自称ChatGPT,真相或指向“AI污染”
全球最新排名:DeepSeek-V3夺开源模型第一!是“新瓶装旧酒”还是实质性突破?业内人士详解
DeepSeek最新模型硬刚o1!英伟达科学家等大佬:这才配叫OpenAI
四川省人大代表马杉:发挥通信领军企业作用,推进5G+工业互联网融合应用
3分钟出报价 记者实测“车险好投保”平台:信息输入后自动跳转到险企投保页面,使用体验很流畅
“DeepSeek或彻底改变游戏规则”!中国大模型“搅动”硅谷,巨头进入恐慌模式,外媒刷屏,大佬发声:中国AI已追上美国
刚刚确认!“80后”电视主持人出任美国防长!他承认付5万美金和解性侵指控
大数据“杀熟”不“杀生”,“骂一骂”真能降价?专家支招不同消费者如何应对算法