【新芒xAI】华为即将发布重磅AI新技术，大幅提升GPU利用率

新芒xAI 11月17日消息华为即将发布重磅AI新技术，有望解决算力资源利用效率难题。

据透露，该技术对标英伟达2024年底斥资7亿美元收购的以色列公司Run: ai的核心技术，延续 “以软件补硬件” 的创新思路，可将GPU、NPU等算力资源利用率从行业平均30%-40%大幅提升至70%，将能实现英伟达、昇腾以及其他三方算力的统一资源管理与利用。

据了解，此技术或基于华为CloudMatrix 384超节点架构扩展，早在2025年WAIC大会上，昇腾384已展示单卡推理性能提升4倍，Decoding吞吐超2300 Tokens/s。

结合OceanStor A系列存储优化，在3D U-Net训练中保持GPU利用率90%以上。此次发布将进一步集成CANN软件栈，支持多模态AI训练与推理，助力智算中心从“硬件堆叠”向“高效协同”转型，预计年底前在芜湖等数据中心规模商用。此举标志华为AI生态加速“国产+兼容”布局，应对全球算力短缺。

新芒xAI评论

华为新技术精准切入AI算力痛点——当前集群利用率低迷（行业均值仅35%），导致万卡级训练成本飙升。

对标Run:ai的调度算法，华为借CANN/MindSpore框架实现跨厂商统一管理，不仅缓解昇腾生态“孤岛”问题，还兼容英伟达硬件，体现“软件中立”战略智慧。

与昇腾384的硬件协同，将推理效率提升4倍，远超H20基准，适用于Llama-3等开源大模型。

优势显着：成本降30%-50%，碳排减排，推动智算中心ROI跃升。然挑战犹存：兼容性验证需海量测试，避免“软件补硬件”成“硬件锁生态”；中美贸易壁垒下，供应链稳定性成隐忧。