新芒xAI 11月17日消息 华为即将发布重磅AI新技术,有望解决算力资源利用效率难题。
据透露,该技术对标英伟达2024年底斥资7亿美元收购的以色列公司Run: ai的核心技术,延续 “以软件补硬件” 的创新思路,可将GPU、NPU等算力资源利用率从行业平均30%-40%大幅提升至70%,将能实现英伟达、昇腾以及其他三方算力的统一资源管理与利用。
据了解,此技术或基于华为CloudMatrix 384超节点架构扩展,早在2025年WAIC大会上,昇腾384已展示单卡推理性能提升4倍,Decoding吞吐超2300 Tokens/s。
结合OceanStor A系列存储优化,在3D U-Net训练中保持GPU利用率90%以上。此次发布将进一步集成CANN软件栈,支持多模态AI训练与推理,助力智算中心从“硬件堆叠”向“高效协同”转型,预计年底前在芜湖等数据中心规模商用。此举标志华为AI生态加速“国产+兼容”布局,应对全球算力短缺。
新芒xAI评论
华为新技术精准切入AI算力痛点——当前集群利用率低迷(行业均值仅35%),导致万卡级训练成本飙升。
对标Run:ai的调度算法,华为借CANN/MindSpore框架实现跨厂商统一管理,不仅缓解昇腾生态“孤岛”问题,还兼容英伟达硬件,体现“软件中立”战略智慧。
与昇腾384的硬件协同,将推理效率提升4倍,远超H20基准,适用于Llama-3等开源大模型。
优势显着:成本降30%-50%,碳排减排,推动智算中心ROI跃升。然挑战犹存:兼容性验证需海量测试,避免“软件补硬件”成“硬件锁生态”;中美贸易壁垒下,供应链稳定性成隐忧。