AI 【新芒xAI】OpenAI×博通联手发布首款自研AI芯片Jalapeño!推理成本直降50%

【新芒xAI】OpenAI×博通联手发布首款自研AI芯片Jalapeño!推理成本直降50%

新芒xAI 6月25日消息 OpenAI联合博通(Broadcom)正式发布双方首款定制化AI推理芯片——Jalapeño,这也是OpenAI自主设计的第一款AI加速芯片。OpenAI目前已收到首批样品,正在测试其运行AI推理任务的能力。

Jalapeño专为大语言模型(LLM)推理场景设计,从初始设计到制造流片仅耗时9个月,由台积电(TSMC)负责制造,服务器系统由Celestica负责搭建。值得一提的是,芯片的设计与优化过程中,OpenAI自身的AI模型也深度参与其中,大幅加速了研发周期——被业界认为是高性能芯片领域有史以来最快的ASIC开发速度之一。

在性能方面,博通CEO陈福阳(Hock Tan)表示,Jalapeño的推理性能可与英伟达Blackwell芯片和谷歌TPU相媲美,而推理成本相比传统AI GPU节省约50%。这一成本优势的核心在于:芯片专为LLM推理场景深度优化,有效解决了通用GPU在该场景下普遍存在的内存带宽瓶颈问题,大幅提升单位算力的性价比。

部署规划上,OpenAI与博通已承诺在微软及其他合作伙伴共建的数据中心中,以"吉瓦级"规模部署自研加速芯片,整体承诺规模达10吉瓦,时间跨度至2029年。大规模量产预计2027年正式启动,并于2028年进一步扩张。

新芒xAI评论

OpenAI发布Jalapeño,是其从AI软件公司向"软硬件一体化"战略转型的关键信号。

长期以来,AI推理的高算力成本是制约大模型规模化商用的核心瓶颈,英伟达GPU的垄断定价更让主要AI玩家承受巨额算力开支。Jalapeño直接指向这一痛点:50%的推理成本节省,对于每天处理数十亿次推理请求的OpenAI而言,意味着每年数十亿美元级别的成本压缩,战略意义不言而喻。

更值得关注的是芯片的开发方式——OpenAI用自己的AI模型辅助芯片设计,将研发周期压缩至9个月,这本身就是"AI加速AI"最有说服力的实证,也预示着未来自研芯片的迭代速度将进一步加快。

从行业格局来看,Jalapeño是继谷歌TPU、亚马逊Trainium/Inferentia之后,科技巨头自研AI芯片阵营的又一重要成员。随着OpenAI正式入局,英伟达在AI推理市场的定价权将面临实质性挑战——这不是"狼来了",而是狼已经到了门口。整个AI算力产业链的竞争格局,正在以超出市场预期的速度加速重塑。

文章来源信息声明: 本文信息出自权威媒体、企业官方及网络,并经新芒X编辑,转载请注明源出处、作者和链接。 图片部分来源于网络,在此表示感谢,如有侵权请联系我方处理。 文章发布日期后方火形图标后的数字,为文章热度,谨代表受欢迎程度。 新芒X平台仅对用户提供信息及决策参考,本文不构成投资建议。

作者: 新芒Group

新芒出品,专注专业。兼具内容品质和传播影响力
关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部