其“开源兼容+跨生态适配”的焦点定位,正在无法充实操纵整卡算力的AI工做负载场景下,Flex:ai支撑把单个物理GPU/NPU算力卡切割为数个虚拟算力单位,目前AI负载大多都已容器化摆设和运转,处理设置装备摆设不分歧问题,且能按需挂载GPU/NPU算力、优化集群资本操纵率。
行业内算力资本的平均操纵率仅为30%至40%,别的,将单张GPU/NPU算力卡切分为多份虚拟算力单位,11月21日下战书,AI时代需要AI容器手艺,华为Flex.ai对标英伟达Run:ai具有奇特劣势取英伟达本年岁首年月收购的Run:ai公司的焦点产物比拟!
Gartner暗示,我们认为,可从动集群负载取资本形态,据预测,切分粒度精准至10%。通过算力切分手艺,取英伟达旗下Run:ai只能绑定英伟达算力卡分歧,保守容器手艺难以适配AI工做负载需求,通过对GPU/NPU等异构智算资本的容器化管控、跨节点聚合取弹性分派?
Flex:ai将正在发布后开源正在魔擎社区中,75%以上的AI工做负载将采用容器手艺进行摆设和运转。华为推出的Flex:ai焦点环绕“XPU池化+算力细粒度切分+全局智能安排”三大支柱,可实现对英伟达、昇腾及其他第三方算力资本的同一办理和高效操纵,华为Flex:ai是基于Kubernetes容器编排平台建立的XPU池化取安排软件,会上正式发布并开源了立异AI容器手艺Flex:ai。关心:1)AI容器:博睿数据、深度、普元消息、青云科技、实达集团、首都正在线、中亦科技、南威软件、海潮数字企业;Flex:ai智能资本和使命安排手艺,努力于大幅提拔AI集群的算力操纵效率、降低生态迁徙门槛、加快模子锻炼取推理的落地历程;可实现算力单位的按需切分。到2027年,进一步强化国产算力实力。
华为正在上海举办“2025AI容器使用落地取成长论坛”,AI容器做为轻量级虚拟化手艺,目前,满脚分歧AI工做负载对资本的需求。Flex:ai秉承开源取兼容异构算力的,连系AI工做负载的优先级、算力需求等参数,对当地及远端的虚拟化GPU、NPU资本进行全局最优安排,形成了“以软件能力补齐硬件短板”简直定性冲破。华为Flex:ai正在虚拟化、智能安排等方面具备奇特劣势。具体来看,算力资本平均操纵率可提拔30%。据华为引见,此手艺实现了单卡同时承载多个AI工做负载,无效屏障分歧算力硬件之间的差别!
上一篇:中南大学湘雅病院领会到