2026-03-24 12:38 点击次数:151

【行家网科技轮廓报谈】3月20日,华为云中小企业AI握住决议发布会上推出了一项算力黑科技——柔性智算操作系统FlexNPU,将Token消费“吞金兽”灵验截止在企业预算限制内,打造面向Agentic时期的极致Token性价比,为企业级智能体的普及打破算力瓶颈。
华为云中国区销售伙伴发展部部长、华为云中国区Marketing与握住决议销售部部长郭婷在致辞中暗示,2026年华为云将构建AI时期愈加裕如的“黑地盘”,让算力工作更柔性、更适配中小企业的轻量化需求,收场从“弯曲靠拍板”到“资本算到精”的出动,握住“用不起、用不好”算力的中枢贫瘠。

企业AI应用近况:一半是海水,一半是火焰
当下,“养龙虾”成为全民热门话题,为千行万业尤其是中小企业提供了开拓智能化职责经由的明晰想路。会上,华为云SMB握住决议与握续运营部部长刘杰用“一半是海水,一半是火焰”生动步地了刻下企业智能化转型的近况:以OpenClaw为代表的先进分娩力用具日出不穷,但AI本体应用经常面对着资本峻岭、本事壁垒、场景错位等挑战。

对此,华为云发布中小企业AI握住决议,涵盖AI基础方法层、模子工作层、智能体平台层、智能体应用层,匡助企业打造能对接ERP、能调用API、能闭环业务经由的“数字职工”。刻下,华为云已长远2600多家企业、30多个行业,握住500多个AI场景化问题,成为企业AI翻新路上的可靠伙伴。
刘杰先容,在AI基础方法层,华为云提供昇腾多代系产物,以及自研的AI Infra OS,尤其是FlexNPU柔性智算本事,一方面闲适中小企业小模子磨练场景,另一方面通过弹性弯曲简略大幅提高资源诈欺率;在模子工作层,华为云支握业界主流开源模子,让企业既能凭证业务需求生动聘请,也能结合自少见据低资本微调专属模子;在智能体平台层,华为云提供易用高效的Agent开发环境,助力开发者和中小企业面向行业结合场景打造企业级智能体;在智能体应用层,华为云结结伙伴长远场景,掩盖洞悉分析、营销运营、协同办公、开发运维、内容制作等高频需求。
刘杰还暗示,华为云接力于提供AI握住决议,米兰作念好基础方法和平台底座,伙伴则提供AI行业握住决议、AI行业场景应用、AI专科工作委派,收场深度共创。会上,华为云发布“加快智能化 企业快成长举止2026”,为中小企业、开发者提供从品牌、生意、本事等全方向的支握,共赢AI市集,共同加快企业智能升级。
打造算力“金箍棒”,大幅责难算力资本
“咱们的推理池平均诈欺率居然不及30%,咱们破耗重金开拓、动辄数万、数十万卡的AI硬件算力池,竟有超过一半以上的算力在‘摸鱼,吃空饷’。”华为云首席架构师、华为公司Fellow顾炯炯在现场抛出了一组惊东谈主数据。他指出,Agent时期企业普遍面对算力痛点:Agent自主倡导、多轮迭代、长陡立文导致Token消费量呈指数级增长,如何灵验责难Token资本,成为最中枢和进攻的挑战。
为此,华为云发布了黑科技——柔性智算FlexNPU,通过构筑强劲而生动的AI Infra层算力弯曲本事,大幅提高推理池的灵验算力诈欺率,爱游戏app从而以换取AI硬件算力干涉,提供更大的Token模糊输出。

关于柔性智算FlexNPU,顾炯炯以可大可小、变化随性的“如意金箍棒”生动步地,暗示FlexNPU赋予NPU/GPU算力“柔性或液态化”供汲取伸缩的武艺,可依据大肆业务需求动态变化随需而动,如同金箍棒一般“可大可小、变化随性”,通过最大化AI算力干涉的诈欺率,最终收场Token性价比的最优化。
具体而言,柔性智算FlexNPU具备极致分享、极致弹性和极致高可用3大属性:
大模子推理方面,FlexNPU通过引入基于柔性算力的PD动态混部、在离线推理混部等翻新本事,完好意思握住了传统PD离别架构下Prefill和Decode集群不平衡的AI Core与显存诈欺率,以及推理业务潮汐变化端正所导致的无数AI算力空转滥用贫瘠,将带来至少40%的Token性价比提高空间
小模子推理方面,FlexNPU通过收场最小粒度达1% NPU卡及128MB显存的颗粒度的AI Core时候复用,以及显存空分复用,为小模子提供信得过完好意思匹配其算力诉求、量文学衣的编造NPU资源,将小模子的平均算力资本责难2-3倍以上;
推理高可用保险方面,FlexNPU通过软硬解耦及Token级KV Cache的及时快照,使得表层推理框架不再需要感知底层的硬件故障,即可收场故障秒级快速复原及断点续推,大大减少了Agent推管待话重计较支出,提高了用户的推理体验
顾炯炯强临了回来到,FlexNPU的中枢价值体当今:无需再为大模子推理的闲置算力,以及小模子推理的独占算力滥用买单,更不再需要为奋斗的故障重算买单,信得过收场了AI算力分拨供给从“资源模式”到“效果模式”的范式出动,“让每分AI算力干涉迸发最大价值,让智能体的海量Token东谈主东谈主消费得起。”
长远千行万业,作念好伙伴AI翻新的“黑地盘”
华为云首先的智能化基础方法,正在成为千行万业伙伴进行本事翻新、产物研发和生意拓展的首要相沿。发布会现场,华为云伙伴代表分享了多个真实案例。
天宽科技有限公司CTO龚徐建先容,天宽科技基于昇腾算力平台打造制造业Agent握住决议,可收场智能常识问答、条约智能审核、风险识别等功能,条约审核准确率达90%,审核效果提高3倍,分娩数据查询时间从1小时镌汰到2分钟,将企业东谈主力从繁琐重叠的职责中目田,两边后续将在市集洞悉、武艺共建、成单旅途等方面进行拓展配合。

天津宏达瑞信科技有限公司CEO丁照祥则从零卖物流行业角度,谈判AI落地带来的浩繁价值,暗示宏达瑞信基于华为云天筹求解武艺,打造AI智能旅途倡导决议,助力商家赢得商品从仓库到经销商的运载最优解,何况不错凭证复杂的交通条款生动确立,排线效果提高60倍以上,减少冗余出车次数20%,物流资本责难5.8%。

东谈主工智能底层本事发展爱游戏,牵引Al Infra算力基础方法、开闭源大小模子、Agent使能框架与用具等快速演进,引发更多AI翻新。面向改日,华为云将秉握“用AI解行业贫瘠”的理念,在应用层、模子层、算力层莳植AI算力黑地盘,联袂伙伴共进共赢,收拢AI时期的机遇。(益达)
乐鱼体育官方网站