在结构性的 AI 推理短缺里,一个垂直整合、不付英伟达税、也不付 HBM 溢价的差异化产能提供方。
它自己造芯片、且不用 HBM。所以在短缺里,它同时绕开了别人都要付的两道抽水:英伟达的硬件毛利,和 HBM 的短缺溢价。
全球唯一商业化量产的整片晶圆处理器。专吃推理里串行、带宽受限的 decode 段,速度最快的那条窄道。
N5 晶圆,不要 HBM、不要 CoWoS。那条卡死 GPU 和所有 HBM-ASIC 的三重瓶颈,它一个都不沾。
自有芯片(免英伟达税)+ 无 HBM(免内存溢价),这是产能提供方里独有的成本结构。
OpenAI 750MW、多年期、$20B+。Backlog ≈ 29× 当年营收,需求已锁死,问题在交付。
现在「慢」不是需求弱,是交付被数据中心部署 gate 住。$25B 已锁定,随自有产能上线 + OpenAI 满产 + AWS(2027)逐步释放,毛利谷底回升是爆发的前置信号。
训练是一次性的;推理是随采用持续放大的。Cerebras 占的「低延迟快推理」是其中增速最快的一段,reasoning 模型每个查询多吃 150× 算力,几乎全是它最快的串行 decode。
推理短缺是结构性的(物理约束多年才能扩,需求复利)。在产能提供方里,Cerebras 的差异化(免双重抽水 + 供给绕开)决定它能捕获的那一片质量更高。
当前是叙事反弹撞进 11 月供给悬崖,毛利与部署的 inflection 还没兑现,接近最差的 lump-in 点。买在反弹,不等于买在底部结构。
5.12 beta + 持续解锁供给 + 基本面未转向。Book A 想要架构期权的,可放极小 tracker、把主仓分批穿过下面的窗口;Book B 想做波段的,现在无信号。下面 4 个是更高胜率的承接点。