AI 【新芒xAI】华为即将发布重磅AI新技术,大幅提升GPU利用率

【新芒xAI】华为即将发布重磅AI新技术,大幅提升GPU利用率

新芒xAI 11月17日消息 华为即将发布重磅AI新技术,有望解决算力资源利用效率难题。

据透露,该技术对标英伟达2024年底斥资7亿美元收购的以色列公司Run: ai的核心技术,延续 “以软件补硬件” 的创新思路,可将GPU、NPU等算力资源利用率从行业平均30%-40%大幅提升至70%,将能实现英伟达、昇腾以及其他三方算力的统一资源管理与利用。

据了解,此技术或基于华为CloudMatrix 384超节点架构扩展,早在2025年WAIC大会上,昇腾384已展示单卡推理性能提升4倍,Decoding吞吐超2300 Tokens/s。

结合OceanStor A系列存储优化,在3D U-Net训练中保持GPU利用率90%以上。此次发布将进一步集成CANN软件栈,支持多模态AI训练与推理,助力智算中心从“硬件堆叠”向“高效协同”转型,预计年底前在芜湖等数据中心规模商用。此举标志华为AI生态加速“国产+兼容”布局,应对全球算力短缺。

华为新技术精准切入AI算力痛点——当前集群利用率低迷(行业均值仅35%),导致万卡级训练成本飙升。

对标Run:ai的调度算法,华为借CANN/MindSpore框架实现跨厂商统一管理,不仅缓解昇腾生态“孤岛”问题,还兼容英伟达硬件,体现“软件中立”战略智慧。

与昇腾384的硬件协同,将推理效率提升4倍,远超H20基准,适用于Llama-3等开源大模型。

优势显着:成本降30%-50%,碳排减排,推动智算中心ROI跃升。然挑战犹存:兼容性验证需海量测试,避免“软件补硬件”成“硬件锁生态”;中美贸易壁垒下,供应链稳定性成隐忧。

文章来源信息声明: 本文信息出自权威媒体、企业官方及网络,并经新芒X编辑,转载请注明源出处、作者和链接。 图片部分来源于网络,在此表示感谢,如有侵权请联系我方处理。 文章发布日期后方火形图标后的数字,为文章热度,谨代表受欢迎程度。 新芒X平台仅对用户提供信息及决策参考,本文不构成投资建议。

作者: 新芒Group

新芒出品,专注专业。兼具内容品质和传播影响力
关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部