新闻动态

硅谷大佬们在X上是如何花式夸DeepSeek的

发布日期:2025-02-04 11:55 点击次数:117

当 DeepSeek(以下简称 DS)成为全球 AI 顶流,X 上也为了它快"吵"起来了。

一边是以 OpenAI 和 Anthropic 为代表的"警惕派",另一边,更多的科技大佬们开始成为了 DeepSeek 的粉丝。

面对中国公司 DeepSeek 的 AI 模型 R1 大杀四方,硅谷大佬们集体破防:马斯克质疑显卡用量,微软调查数据来源,美国政客甚至搬出"盗取技术"的帽子——素有"硅谷鲁迅"之称的 LeCun 反手在 X 上开启了反讽模式。

话里话外强调着科学进步靠的是"全球学霸组队刷题",而不是"学霸笔记加密上锁"。

另一边,HuggingFace 联合创始人 Thomas Wolf 直接当起了课代表,替网友们总结 DS 曝光以来,他们的所见所想。尽管这一部分来自于开源社区和开源模型天然站在同一条战线上,但 Thomas 本人几度认为 DS 和 R1 是历史性的颠覆时刻。

作为 Anthropic 的忠实崇拜者和 Claude 的长期用户,当 Thomas 看到了 Dario 关于 DS 和出口管制的文章,他诚实地表示:相当痛苦。

"这篇文章的前半部分读起来像是一篇冗长的尝试,试图证明闭源模型仍然明显领先于 DeepSeek。如果 DeepSeek 和 Anthropic 模型都是闭源的,是的,军备竞赛的解释可能是有道理的,但是在我看来,让其中一个模型可以免费下载并附有详细的科学报告,这使得整个‘闭源军备竞赛’的论点变得人为且没有说服力。"

开源没有国界。Aitomatic 创始人兼 CEO Christopher Nguyen 甚至认为,开源并不是一种策略,而是一种必然。

当然,AWS、Azure 和 Nvidia 这些直接的利益相关者一边迫不及待身体力行的在自己的云平台上部署 R1 和 R1-Zero,另一边也在 X 上以此为机会,来俘获开发者们的芳心。

Perplexity 创始人 Aravind Srinivas 在 R1 刚刚出现时,其团队便将其与 o3 进行详细的测试和比对,最终得出的结论是:比 o3 更聪明。

甚至直接将美版 R1 接入了 Perplexity 中,为 Pro 用户提供每天 500 次的 R1 查询。

除了受益于 R1 开源战略的直接利益相关者,另一部分的粉丝则是惊叹于 DeepSeek 对于成本的极限控制,尽管这并不是什么新鲜事,但 R1 让整个技术界,又震惊了一次。

曾任 Tesla 总监,也是 OpenAI 的前创始团队之一的 Andrej Karpathy,直接称:美国在数据和算法层面还有很多工作要做。他举例:同样级别的 Llama 3 405B 使用了 30.8M GPU 小时,而 DeepSeek-V3 看起来是一个更强大的模型,只用了 2.8M GPU 小时(计算量减少了 ~11 倍)。

Scale.ai 创始 Alexandr Wang 提到了 R1 在训练数据方面的突破了世界纪录,并更重视数据标注,CEO 亲自为模型进行标注。"这让我想起了 Karpathy 当年,曾经在特斯拉花了四分之一的时间进行标注。DeepSeek-v3 论文甚至有一个专门的数据标注部分 。"

Midjourney 创始人 David Holz 甚至已经成为了 DS 的小迷弟,David 一直在思考 AI 与人类的本质区别等哲学问题,DS 的回答让他感到惊喜。

DeepSeek 把学术研究和工程落地揉成了组合拳。一边发前沿论文定义新标准,一边开源实用工具降低使用门槛,这种"两条腿走路"的策略反而撕开了行业痛点:大多数团队还在纠结技术路线时,他们已经把方案塞进了开发者的日常工作流。或许 AI 创新的关键,就是把实验室的突破变成程序员键盘上的默认选项。

可以预见的是,这些海外大佬"自来水"还会越来越多。说到底,这些热闹都是因为 DeepSeek 的技术干货够硬。当技术方案真正解决问题时,所谓的"东西方差异"会自动消失。

澳门新葡游戏网乐规则怎么玩介绍 产品展示 新闻动态
电话:
邮箱:
地址:
澳门新葡游戏网乐规则怎么玩

Powered by 澳门新葡游戏网乐规则怎么玩 RSS地图 HTML地图

Copyright Powered by365建站 © 2013-2024