
发布日期:2024-10-20 01:57 点击次数:89
文摘受权转载自夕小瑶科技说澳门六合彩官网
最近 DeepSeek 竟然是全网刷屏!
前几天发布的 V3 给咱们的大飘荡还没消灭呢!DeepSeek-R1 一来,又引爆了民众的 AI 社区!
好家伙,最新发布的 R1 在 AIME2024 数学基准测试中 79.8% 顺利踢走OpenAI 的 o1 ,在措施化编码测试中,DeepSeek-R1 也展现出“巨匠级”水平,在 Codeforces 平台上获得了 2029 Elo 评级,突出了 96.3% 的东谈主类竞争者。
R1 不仅以 MIT 许可(最宽松的规格)统统开源,况兼,老本上风很是大,每百万 token 的查询老本仅为 0.14 好意思元,相较于 OpenAI 的 7.50 好意思元,老本骤降 98%。
竟然是太牛了!
DeepSeek 的横空出世,如同在稳重的硅谷投下了一枚飘荡弹。
好意思国恐慌着其东谈主工智能限制的霸主地位是否岌岌可危,这会 DeepSeek 的大告成,在民众掀翻了一股“复现”海潮不说,更将硅谷的恐慌推向顶峰。 这份恐慌,并非只是是对期间失利的担忧,而是对本身模式和改日政策的深刻反念念与从头谛视。
与此同期,Meta 的职工在好意思国匿名职场社区 teamblind 发布了一个公开的帖子,称Meta 生成式 AI 团队对 低老本和高性能的 DeepSeek V3 的出现感到很是很是“担忧”:
DeepSeek-V3 的出现是这一切的导火索,它在性能基准测试中已提升于 Llama 4。 更令东谈主不安的是,这款模子竟来自一家“熟习预算仅 550 万好意思元的中国公司”。 工程师们正负重致远地分析 DeepSeek,试图从中找到冲破口。 这绝非虚言。 顾问层正面对如何讲明腾贵的生成式 AI 部门老本的打扰。 当部门内宽敞“领导”的薪资总额远超 DeepSeek-V3 的熟习预算时,他们将如何朝上司打法?DeepSeek-R1 的出现更令样式雪上加霜,具体情况虽未便清晰,但很快将公开。 本部门底本应是一个精干的工程团队,但由于过度膨胀,导致后果低下,最终所有这个词东谈主齐受其害。
这个帖子激发了很是热烈的商讨,有的东谈主回顾英伟达的卡卖不出去了,有东谈主回顾 Meta 本年将推出的 Llama4 打不外V3,而就昨天,Meta 的首席科学家下场了!
LeCun在 X(推特)上发帖称当今的恐慌的主义是错的,与其关注其霸主地位澳门六合彩官网,不如怜惜开源与闭源的输赢:
给那些看到 DeepSeek 的发达后,认为「中国在 AI 方面正在突出好意思国」的东谈主: 你们的解读是错的。 正确的解读应该是:「开源模子正在突出私有模子。」 DeepSeek 收货于开源掂量和开源名目(举例 PyTorch 和来自 Meta 的 Llama)。 他们在他东谈主责任的基础上建议了新主见并进行了构建。 因为他们的责任是公开且开源的,是以每个东谈主都能从中受益。 这即是绽开掂量与开源的力量。
小鹿看到 LeCun 的指摘区中被点赞相比高的指摘,照旧在一直商讨究竟好意思国和中国谁先达到 AGI:
以致还有好意思国网友阴阳中国事鹈鹕,是靠吃掉了好意思国的 AI 模子才变强的:
以致 Meta 的 CEO 扎克伯格也还在关注这场战怎么打才能赢,在 LeCun 发言不久他就在 Facebook 上文书:
加快研发 Llama 4,估量投资 650 亿好意思元扩建数据中心,并部署 130 万枚 GPU 以确保 2025 年 Meta AI 成为民众提升模子。
在 DeepSeek V2 模子发布之际,“暗涌”采访了 DeepSeek CEO 梁文锋时,梁涵养其时也提到了这个问题,顺利驳斥了好意思国的偏见:
暗涌发问:互联网和移动互联网期间留给大部分东谈主的惯性判辨是,好意思国擅长搞期间革命,中国更擅长作念利用。 梁文锋答: 咱们认为跟着经济发展,中国也要缓缓成为孝敬者,而不是一直搭便车。以前三十多年 IT 海潮里,咱们基本莫得参与到实在的期间革命里。咱们一经风气摩尔定律从天而下,躺在家里 18 个月就会出来更好的硬件和软件。Scaling Law 也在被如斯对待。但其实,这是西方主导的期间社区一代代皓首穷经创造出来的,只因为之前咱们莫得参与这个历程,以至于无情了它的存在。 暗涌发问:为什么 DeepSeek V2 会让硅谷的许多东谈主骇怪? 梁文锋答: 在好意思国每天发生的大都革命里,这黑白常粗俗的一个。他们之是以骇怪,是因为这是一个中国公司,在以革命孝敬者的身份,加入到他们游戏里去。毕竟大部分中国公司风气 follow,而不是革命。
硅谷此次的震恐,恰恰印证了他们永恒以来对中国科技革命抱有的偏见,这种偏见大到盖过了关键问题的试验。
他们戴着“有色眼镜”,气焰万丈地申辩中国革命才能,却统统没异常志到,实在巧得他们关注的,根柢不是什么“国度突出”,而是开源模式的崛起过头对民众 AI 发展的真切真理。
DeepSeek 就像一个厨师,他作念菜作念得尽头厚味 ~
但他不是编造变出来的,他用了别东谈主公开的菜谱(开源掂量),用了别东谈主免费提供的器具(开源名目,比如 PyTorch 和 Llama),用了别东谈主免费的面粉、免费的烤箱,重逢通我方的关键的革命小配方,然后作念出了好意思味的面包。
更棒的是,这个厨师作念完面包,也把我方的新菜谱公开了! 这么一来,其他厨师也能学,也能在它的基础改变,也能作念出更厚味的面包。
这么的力量是用之束缚不会缺少况兼很是广泛的!
因此,要是硅谷对 DeepSeek 告成的解读只是停留在“中国 AI 突飞大进,突出好意思国 AI”的层面,那无疑是一种方法窄小的判辨。
实在巧得深念念的是 DeepSeek 背后所代表的 AI 掂量开源模式。 恰是这种绽开分享的模式,让民众的掂量者得以站在巨东谈主的肩膀上,相互模仿,共同精进,最终鞭策 AI 期间朝着更健康、更普惠的主义发展。
这才是 DeepSeek 的告成为硅谷,乃至通盘 AI 限制带来的更真切、也更值得关注的启示 ~
参考文件https://mp.weixin.qq.com/s/bLiV7dOiMsSIUo6LRLbPKwhttps://x.com/ylecun/status/1883002229977915535
GPU算力按需租用
A100/H100 GPU算力按需租用,
秒级计费,平均节俭开支30%以上!
扫码了解信赖☝
1. 白粥面条养胃?——长期吃不利于胃健康澳门六合彩官网