> 资讯

Forrester预测2026!九章云极强化学习云正助力企业拥有“超级Agent”

2025-12-03 来源:互联网

  在AI Agent规模化落地的进程中,成本可控与效率提升的协同平衡,已成为企业核心诉求。强化学习(RL)凭借赋予AI“边做边学”的自适应能力,成为破解这一矛盾的关键技术——通过与真实环境持续交互优化策略,智能体可在业务场景中动态迭代,摆脱对静态模型的依赖,从根本上重塑成本与效率的关系。

  行业数据印证了其战略价值:Forrester预测,2025年将有59%的中国企业迈入强化学习高级应用阶段,80%的组织将其列为AI基础设施云的核心投入方向;Gartner更将“Agentic AI”列为2025年十大战略技术趋势之首,IDC则指出价值6500亿美元的企业软件市场将被AI Agent彻底重塑。

  数据来源:Forrester《Ushering In The Era Of AI Infrastructure Cloud:A Key Trend In China》:中国AI基础设施重要趋势:普惠智算云时代来临,2025年12月)

  强化学习对提升AI智能体可靠性至关重要,但长期以来难以普及。传统强化学习不仅需投入昂贵基础设施、储备深厚专业知识,且工作流程耗时冗长,严重拖累技术迭代速度。而无服务器强化学习(Serverless RL)的出现有效打破这些壁垒,无论经验丰富的开发者还是行业新手,都能获得更优开发体验。

  近日,AI基础设施独角兽九章云极DataCanvas升级旗下无服务器强化学习平台AgentiCTRL,以“低门槛、高性能、全周期”为核心,提供从训练到推理的一站式工具链,从根本上降低企业应用强化学习的技术与成本门槛。作为国内首个完全托管、公开可用的强化学习训练与部署解决方案,该平台专为构建高可靠性AI Agent设计——开发者无需搭建AI基础设施,即可实现多GPU扩展部署,在最大限度降低硬件投入的同时,大幅缩减DevOps运维时间。

(数据来源:九章云极无服务器强化学习平台AgentiCTRL,2025年12月)

  基准测试数据直观印证了其“降本增效”的核心价值:相较于传统强化学习部署方案,AgentiCTRL使Agent训练速度提升近1.4倍,综合成本下降60%,采样轨迹延迟降低80%以上(对比传统集中式算力调度方案)。这一突破的关键在于九章云极解决了强化学习训练中的“掉队问题”——即分布式训练中部分算力节点因性能差异拖慢整体进度的现象。通过九章智算云Alaya NeW Cloud异构算力环境复用多训练任务,系统维持高资源利用率,结合“一度计费”模式(按实际算力使用量计费),实现资源高效复用与成本精准管控的双重目标。

  AgentiCTRL不仅解决了强化学习的“可用性”问题,更展现出卓越的工程化能力。该平台与九章智算云全栈服务紧密集成,融合异构算力调度、Kubernetes原生部署与ModelOps闭环管理,开发者无需重构现有系统即可无缝接入强化学习能力。平台内置的GRPO(Group Relative Policy Optimization)算法尤为值得关注——这是一种针对强化学习的梯度优化算法,能通过精准控制模型参数更新节奏,减少“参数反复调整”带来的无效算力消耗,大幅降低奖励工程复杂度,使多步骤智能体训练周期缩短60%以上,GPU利用率从59%提升至84%。

  借助动态环境交互、奖励信号反馈与策略迭代优化机制,AgentiCTRL赋能AI智能体在真实业务中持续学习、自我修正。技术实践证实:深度集成强化学习后,仅24亿参数的行业大模型,在代码生成、数学推理等强逻辑任务上的综合表现,已达到甚至局部超越70亿参数通用大模型水平。这种“小模型+强策略”的路径,既重新定义企业级AI的效率边界,又通过减少大模型算力消耗有效缓解算力焦虑,为AI普惠开辟了高性价比路径。

(数据来源:九章云极无服务器强化学习平台AgentiCTRL,2025年12月)

  更具里程碑意义的是,AgentiCTRL将无服务器强化学习从模型训练的“后处理工具”,升级为贯穿智能体Agent全生命周期的“策略大脑”。在金融风控场景,智能体通过模拟千万次交易决策自主识别欺诈模式,使风控误判率下降;在制造质检环节,可依据产线实时数据毫秒级调整检测阈值——这种“边做边学”的核心能力,是传统静态训练方法难以企及的。

  目前,AgentiCTRL方案已在多行业落地并转化为实际价值:AI工业设计平台三维家借此提升个性化家居生成效率,出图速度提升3倍;视觉科技企业格灵深瞳依托其优化多模态端到端模型训练,高效应对高算力挑战。截至2025年12月,AgentiCTRL已覆盖制造、金融、医疗等多领域,成为企业构建“懂业务的智能体Agent”的首选平台。

  Forrester数据显示,67%的中国企业优先通过Kubernetes强化学习加速AI创新以提升投资回报率,强化学习能力已成为企业选择AI基础设施云供应商的核心标准之一。而九章云极AgentiCTRL作为无服务器强化学习云服务的标杆产品,也为行业同类服务商树立了技术与服务典范。

  测算显示,随着Agent中的大规模应用,企业算力需求将呈指数级增长,其中推理负载占比会显著提升,强化学习是均衡算力、数据、模型的关键技术。九章云极打造的“小参数+Serverless RL”强化学习系统性优势,不仅有效缓解算力焦虑,更是以低准入门槛、高性价比的普惠方式深度融入AI Agent经济体系。这种将成本控制与效率提升完美结合的实践,不仅是企业构建专属智能体Agent的核心选择,也将成为未来十年技术持续进化的重要方向。

回到顶部