【新芒xAI】OpenAI×博通联手发布首款自研AI芯片Jalapeño！推理成本直降50%

新芒xAI 6月25日消息 OpenAI联合博通（Broadcom）正式发布双方首款定制化AI推理芯片——Jalapeño，这也是OpenAI自主设计的第一款AI加速芯片。OpenAI目前已收到首批样品，正在测试其运行AI推理任务的能力。

Jalapeño专为大语言模型（LLM）推理场景设计，从初始设计到制造流片仅耗时9个月，由台积电（TSMC）负责制造，服务器系统由Celestica负责搭建。值得一提的是，芯片的设计与优化过程中，OpenAI自身的AI模型也深度参与其中，大幅加速了研发周期——被业界认为是高性能芯片领域有史以来最快的ASIC开发速度之一。

在性能方面，博通CEO陈福阳（Hock Tan）表示，Jalapeño的推理性能可与英伟达Blackwell芯片和谷歌TPU相媲美，而推理成本相比传统AI GPU节省约50%。这一成本优势的核心在于：芯片专为LLM推理场景深度优化，有效解决了通用GPU在该场景下普遍存在的内存带宽瓶颈问题，大幅提升单位算力的性价比。

部署规划上，OpenAI与博通已承诺在微软及其他合作伙伴共建的数据中心中，以"吉瓦级"规模部署自研加速芯片，整体承诺规模达10吉瓦，时间跨度至2029年。大规模量产预计2027年正式启动，并于2028年进一步扩张。

新芒xAI评论

OpenAI发布Jalapeño，是其从AI软件公司向"软硬件一体化"战略转型的关键信号。

长期以来，AI推理的高算力成本是制约大模型规模化商用的核心瓶颈，英伟达GPU的垄断定价更让主要AI玩家承受巨额算力开支。Jalapeño直接指向这一痛点：50%的推理成本节省，对于每天处理数十亿次推理请求的OpenAI而言，意味着每年数十亿美元级别的成本压缩，战略意义不言而喻。

更值得关注的是芯片的开发方式——OpenAI用自己的AI模型辅助芯片设计，将研发周期压缩至9个月，这本身就是"AI加速AI"最有说服力的实证，也预示着未来自研芯片的迭代速度将进一步加快。

从行业格局来看，Jalapeño是继谷歌TPU、亚马逊Trainium/Inferentia之后，科技巨头自研AI芯片阵营的又一重要成员。随着OpenAI正式入局，英伟达在AI推理市场的定价权将面临实质性挑战——这不是"狼来了"，而是狼已经到了门口。整个AI算力产业链的竞争格局，正在以超出市场预期的速度加速重塑。

打赏

【新芒xAI】OpenAI×博通联手发布首款自研AI芯片Jalapeño！推理成本直降50%

作者: 新芒Group

微信扫一扫关注我们