香港六合彩直播在线观看 Meta堕入惊恐?里面爆料:在豪恣分析复制DeepSeek,高预算难以解释

香港六合彩网站

香港六合彩直播在线观看 Meta堕入惊恐?里面爆料:在豪恣分析复制DeepSeek,高预算难以解释

发布日期：2024-12-09 12:07 点击次数：191

机器之心报谈香港六合彩直播在线观看

机器之心剪辑部

「工程师正在豪恣地分析 DeepSeek，试图从中复制任何可能的东西。」

DeepSeek 开源大模子的阳谋，切切实实震憾着好意思国 AI 公司。

最先堕入惊恐的，似乎是相通珍摄开源的 Meta。

最近，有 Meta 职工在好意思国匿名职场社区 teamblind 上头发布了一个帖子。帖子提到，国内 AI 创业公司 DeepSeek 最近的一系列行为让 Meta 的生成式 AI 团队堕入了惊恐，因为在前者的低本钱高唱大进下，后者无法解释我方的超高预算的合感性。

原文如下：香港六合彩直播在线观看

这一切始于 DeepSeek-V3，它在基准测试中就如故让 Llama 4 过期。更倒霉的是阿谁「领有 550 万磨砺预算的不著明中国公司」。工程师们正在豪恣地分析 DeepSeek，试图从中复制任何可能的东西。这少量齐不夸张。处置层惦记怎么诠释广漠的生成式 AI 组织的本钱是合理的。当生成式 AI 组织中的每个「训诫」的薪资齐比磨砺扫数这个词 DeepSeek-V3 的本钱还要高，而咱们有好几十个这么的「训诫」时，他们要怎么濒临高层？DeepSeek-R1 让情况变得愈加可怕。天然我不可知道隐秘信息，但这些很快就会公开。这本应该是一个以工程为要点的袖珍组织，然则因为许多东谈主念念要参与进来分一杯羹，东谈主为地延伸了组织的招聘限制，恶果每个东谈主齐成了输家。

原贴蚁合：https://www.teamblind.com/post/Meta-genai-org-in-panic-mode-KccnF41n

帖子中提到的 DeepSeek-V3 和 DeepSeek-R1 远隔发布于 2024 年 12 月 26 日和 2025 年 1 月 20 日。

其中，DeepSeek-V3 在发布时提到，该模子在多项评测获利高出了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模子，并在性能上和天下顶尖的闭源模子 GPT-4o 以及 Claude-3.5-Sonnet 不分昆季。

不外，更引东谈主怜惜的是，这个参数目高达 671B 的大型话语模子磨砺本钱仅 558 万好意思元。具体来说，它的预磨砺历程居然只用了 266.4 万 H800 GPU Hours，再加上凹凸文扩展与后磨砺的磨砺，悉数也唯有 278.8 H800 GPU Hours。相较之下，Meta 的 Llama 3 系列模子的野心预算则多达 3930 万 H100 GPU Hours—— 如斯野心量足可磨砺 DeepSeek-V3 至少 15 次。

而最近发布的 DeepSeek-R1 性能更猛 —— 在数学、代码、天然话语推理等任务上，它的性能并列 OpenAI o1 郑再版。何况模子在发布的同期，权重同步开源。许多东谈主惊呼，底本 DeepSeek 才是实在的 OpenAI。UC Berkeley 教授 Alex Dimakis 则以为， DeepSeek 刻下如故处于向上位置，好意思国公司可能需要振奋为雄了。