OpenAI 拿下五角大楼合同、DeepSeek V4 瞄准 Sonnet、CPU/GPU 比率翻转
今日新增 15 条声明,来自 14 个来源,新增 10 条图谱边(提议者 6 条 + 修复 4 条)。头条信号:OpenAI 赢得 Anthropic 失去的 2 亿美元五角大楼合同,DeepSeek 发布针对中国芯片优化的 V4 规格,一位行业内部人士提出 CPU 将在推理数据中心中超过 GPU 的论点。同时,NVIDIA 以 20 亿美元投资 Coherent 深化光互连布局,Meta 单个园区将消耗 800 万英里光纤。
1. OpenAI 赢得 2 亿美元五角大楼合同
OpenAI 与五角大楼的关系有了具体价码。Anthropic 在这份 2 亿美元合同中败给了 OpenAI,为 OpenAI 在机密军事网络部署 AI 模型的现有叙事增添了具体金额。
- 2 亿美元合同金额 — 首次为 OpenAI-五角大楼关系附上具体美元数字。此前我们只知道机密网络部署协议。(@minchoi)
- Anthropic 明确落败 — 不仅是主动退出,而是竞争性失利。为正在进行的诉讼和供应链风险认定增加了背景。(@minchoi)
- 监管分化加深 — OpenAI 现在拥有确认金额的国防合同,同时公开为 Anthropic 辩护反对供应链认定。在市场上竞争,在法庭上支持。
此声明现已连接到监管集群中的 3 条现有声明:OpenAI 带有分层保护的国防部协定、机密网络部署以及 Anthropic 的供应链风险认定。2 亿美元的数字将现有叙事从”OpenAI 正在与军方合作”精炼为”OpenAI 赢得了 Anthropic 失去的特定合同”。
2. DeepSeek V4 规格:两款模型,两种策略
DeepSeek 推出 V4 的两个变体,各自瞄准不同的竞争轴心:
- V4 lite (2850 亿参数) — 定位直接与 Anthropic 的 Sonnet 4.6 竞争。这是面向西方推理市场的”快速高效”模型。(@zephyr_z9)
- V4 big (1 万亿参数) — 多模态(文本 + 图像 + 视频),针对华为和寒武纪芯片优化。这是国产中国芯片路线,减少对 NVIDIA 硬件的依赖。(@minchoi)
- 硬件分化 — DeepSeek 正在绕过让 NVIDIA 和 AMD 为其硬件优化 V4 的常规步骤(知识库中已有声明)。V4 big 以中国芯片为先设计。
万亿参数声明精炼了知识库中关于 DeepSeek V4 华为/寒武纪优化的现有条目,增加了具体参数数量和多模态能力。V4 lite 声明是新信号 — 首次提及专门针对 Sonnet 4.6 的较小模型变体。
3. CPU/GPU 比率翻转
Ben Bajarin 提出了一个结构性论点,可能重塑我们对推理数据中心经济学的理解:
- CPU 将超过 GPU — 在纯推理数据中心中,随着 AI 代理模型的演进。比率翻转 — 推理工作负载需要更多编排计算而非原始 GPU 吞吐量。(@BenBajarin)
- Intel 代工论点 — 如果 AI 代理 CPU 驱动大量需求,Intel 的代工业务就有了生命线。Bajarin 将其定位为 Intel 制造战略的潜在救星。(@BenBajarin)
- 与现有证据趋同 — 知识库已持有”AI 代理工作负载是 CPU 瓶颈”的声明,仅每天 1 小时的代理使用就需要将 CPU 安装基数翻倍。Bajarin 的预测从独立来源支持了这一点。
如果这一论点正确,将产生巨大影响。这意味着 AI 基础设施建设不仅仅是关于 GPU — 还有一个平行的 CPU 超级周期,将惠及 Intel 和 AMD 的 EPYC 产品线。修复过程将两条新声明链接到现有 CPU 瓶颈论点,使其增强至 2 个独立支持来源。
4. 物理层:光纤、内存和光互连
当所有人都在讨论 GPU 大战时,物理基础设施层正以惊人的速度扩展:
- Meta 单个数据中心园区:800 万英里康宁光纤 — 一个园区,一家公司,足以往返太阳 40 次的光纤。AI 基础设施中铜到光纤的转型已经到来。(@BenBajarin, 行业内部人士)
- NVIDIA 投资 20 亿美元于 Coherent ($COHR) 加上多年期多产品供应协议。NVIDIA 锁定到 2030 年的共封装光学器件供应,收入贡献从 2027 年开始。@PatrickMoorhead 独立确认了知识库中已有的交易。
- Micron 出货 256GB SOCAMM2 — 全球首款,专为 AI 代理工作负载设计。代理时代的专用内存形态。(@hms1193, 金融记者)
- Micron-NVIDIA 内存联合设计 — 为 AI 基础设施需求协作研发先进内存。支持 Micron 预计为 NVIDIA Vera Rubin 平台供货的现有声明。(@BenBajarin)
物理层讲述了 GPU 头条所遗漏的故事。NVIDIA 不仅在卖芯片 — 它正在垂直整合光互连(Coherent)和联合设计内存(Micron)。Meta 不仅在买 GPU — 它在为单个园区铺设 800 万英里光纤。基础设施护城河正在玻璃和硅片中建造,而不仅仅是软件。
5. 电网承压:PJM 9.3 倍
PJM 容量价格经历了 9.3 倍增长,由数据中心电力需求和 SemiAnalysis 所称的”糟糕的市场设计”驱动。这精炼了 BloombergNEF 关于 PJM 数据中心容量到 2030 年可达 31 GW 的现有预测。
- 9.3 倍容量价格增长 — 我们所见到的数据中心电力紧缩最具体的定价指标。不仅是需求增长,而是确保容量的成本正在爆炸。(@SemiAnalysis_)
- 现有背景 — 知识库已持有 PJM 互联队列数据(2,600 GW 待处理,12 年延迟)和 BloombergNEF 的 106 GW 美国需求预测。9.3 倍价格增长是这些物理约束的财务后果。
电力故事持续恶化。物理约束(变压器、冷却、电网互连)是 AI 基础设施部署的硬约束,而价格信号现在正在尖叫。
新信号:首次提及
这些声明在知识库中没有先前的边 — 可能是进入视野的新信息:
- Intel Clearwater Forest (Xeon 6+) — 通过 12 个 Intel 18A 计算瓦片实现多达 288 个 Darkmont E-core。知识库中首个 Intel 18A 产品声明。(@PatrickMoorhead)
- Qualcomm AI200 — 在 MWC 2026 展示的数据中心机架。NVIDIA 和 AMD 之外的推理硬件市场新进入者。(@PatrickMoorhead)
- AMD Zen 6 (Medusa) / Zen 7 (Grimlock) — 下一代 CPU 路线图,在游戏和 AI 市场与 Intel Nova Lake 竞争。(@mooreslawisdead)
- Junyang 离开通义千问 — 阿里巴巴通义千问 AI 团队关键负责人离职。中国领先 AI 实验室之一的潜在人才中断。(@zephyr_z9)
- AMD 印度开发者计划 — 使用 ROCm 开源软件栈加速印度 AI 开发。(@AIatAMD, 官方账号)
关注要点
- DeepSeek V4 lite 基准测试 — 如果真的能与 Sonnet 4.6 竞争,将验证中国开源 AI 在前沿质量上的论点。
- Intel 18A 良率 — 288 核的 Clearwater Forest 在纸面上令人印象深刻,但 18A 制造良率是 Intel 代工的成败关键。
- PJM 容量拍卖 — 9.3 倍价格增长不可持续。关注政策回应或需求破坏信号。
- Anthropic 的下一步 — 失去了 2 亿美元五角大楼合同并在对抗供应链认定。收入蓬勃发展(140 亿美元 ARR)但监管阴影加深。
- Micron SOCAMM2 采用 — 首个面向 AI 代理的专用内存形态。如果超大规模公司采用,标志着代理基础设施建设是真实的。