要闻 经济 栏目首页 聚焦 科技 连接 系统 产品 联想专题 资讯 金融 科技 理财 财经 知识 金融 游戏
首页 > > 正文

F5携手NVIDIA提升AI工厂经济效益,赋能加速AI推理

2026-03-27 17:56:18来源:实况网

基于NVIDIA BlueField DPU加速的 F5 BIG-IP Next for Kubernetes 实现更高Token吞吐、更低单Token成本,并支持安全的多租户AI基础设施,助力智能体时代下的AI工厂转型。

西雅图-全球领先的应用交付和API安全解决方案提供商F5(NASDAQ: FFIV)日前宣布,进一步扩展与NVIDIA的深度合作,旨在加速并优化AI推理基础设施。

此次升级整合了F5 BIG-IP Next for Kubernetes与 NVIDIA BlueField-3 DPU,构建出具备智能化与遥测感知能力的基础设施层。在提升GPU利用率的同时,该解决方案能够显著提升GPU利用率及Token吞吐量、降低时延,并支持在大规模环境下构建安全的多租户AI平台。

在AI系统中,Token是衡量AI输出的基本单位,即在推理过程中生成和处理的词语、符号或数据片段。Token产出的规模与速度,直接决定了用户体验、基础设施效率以及单加速器的收益能力。

随着企业与GPU即服务(GPUaaS)提供商加速推动AI商业化,并从实验阶段迈向规模化创收,基础设施效率正成为关键衡量指标。当前,行业衡量标准正从单纯的GPU部署规模,转向更精细化的Token经济指标,包括Token吞吐量、首个Token时间(TTFT)、单Token成本以及单GPU收入等。F5与NVIDIA的联合解决方案,正是围绕这些核心指标进行优化设计,助力客户实现AI投资回报最大化。

通过智能化 AI 基础设施优化 Token 经济性

从以应用为中心的推理转向由智能体驱动的AI工作流,迫切需要新的架构设计,以提升token吞吐效率并降低成本。F5 BIG-IP Next for Kubernetes现已深度集成NVIDIA NIM 统计数据、Dynamo运行时信号以及GPU遥测信息,实现在推理执行前即可进行感知推理状态的流量调度决策。通过实时将工作负载匹配至最合适的加速器资源,该解决方案在提升持续利用率的同时,有效降低推理时延与重复计算。

F5首席产品官Kunal Anand表示,“AI基础设施已不再只是获取GPU资源或扩大部署规模,而是演进为如何最大化单块加速器所产生的经济价值。通过与NVIDIA的合作,我们助力AI工厂将Token产出转化为可量化的业务指标。BIG-IP Next for Kubernetes提供所需的智能调度与治理能力,帮助企业提升GPU产出效率、降低单Token成本,并更自信地扩展共享型AI平台。”

经验证的基础设施效率提升:结构性跃迁

性能数据充分印证了这一点。在The Tolly Group的验证测试中,基于NVIDIA BlueField-3 DPU加速的F5 BIG-IP Next for Kubernetes,实现了最高达40%的Token吞吐提升、首个Token时间加快61%,以及整体请求时延降低34%。

这并非渐进式优化,而是架构层面的效率跃迁。通过将网络处理、TLS/加密、AI感知负载均衡及流量管理等任务卸载至NVIDIA BlueField-3 DPU,BIG-IP Next for Kubernetes能够有效释放主机CPU资源,并让GPU专注于其核心职责,即在大规模场景下执行持续、高吞吐的AI推理计算。这一架构实现了GPU利用率显著提升、排队延迟减少,以及Token产出能力增强,从而在固定基础设施规模下实现更低的单Token成本。更为关键的是,这一系列性能提升无需对模型本身进行任何修改,可直接应用于现有AI工厂基础设施。对于在Token经济学赛道展开竞争的企业及NeoCloud服务提供商而言,这意味着从限制AI产出的基础设施,迈向加速AI产出的关键转变。

NVIDIA网络业务高级副总裁Kevin Deierling表示,“NVIDIA加速计算基础设施与F5具备AI的应用交付与安全平台相结合,能够显著提升AI工厂的Token 经济效益,并在无需修改模型的前提下,实现可扩展且具备成本效率的推理能力。F5与NVIDIA正携手助力企业以更高效、更经济的方式扩展AI工厂推理能力。”

面向智能体驱动AI与多租户平台构建

现代AI工作负载正日益呈现出智能体驱动、持久化与上下文感知。这类新型负载对流量调度提出了更高要求,传统负载均衡已难以胜任。F5 BIG-IP Next for Kubernetes增强版现已支持以下核心能力:

· 面向智能体AI工作流的推理感知路由。

· 集成NVIDIA DOCA Platform Framework(DPF),简化NVIDIA BlueField DPU的部署与全生命周期管理。

· 基于EVPN-VXLAN与动态VRF的网络级多租户隔离能力。

· 在Kubernetes AI环境中内建安全能力、Token治理与可观测性。

这些能力赋能企业与NeoCloud服务提供商能够在共享 GPU 基础设施的同时,实现跨业务单元或外部客户的安全隔离,在保障性能隔离性的前提下,维持可预测的服务水平。

面向AI工厂经济学的控制平面

F5与NVIDIA为企业提供经过验证的工具与最佳实践,助力优化推理架构。基于上述能力升级,F5 BIG-IP Next for Kubernetes正在演进为AI工厂经济学的战略级控制平面,实现治理Token消耗、优化流量路径,并最大限度地提升基础设施的投资回报率(ROI)。

基于此,企业无需再通过过度资源预留来弥补效率损耗,而是能够从现有已部署GPU资源中释放更高的经济价值。由此带来一系列关键业务收益,包括:单GPU收入提升、运维成本降低,并能构建起支撑持续增长的可扩展AI服务。通过深度融合NVIDIA的基础设施遥测与DPU加速能力,以及F5在流量智能与安全领域的核心优势,双方正助力企业将AI工厂从计算资源平台转化为高效、可变现的业务平台,从而为智能体时代做好充分准备。

附加资源

· 博客文章:AI工厂需要智能化基础设施:The Tolly Group最新测试结果深度解析

· 技术报告:The Tolly Group独立测试报告:F5 BIG-IP Next for Kubernetes性能验证全记录

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

关键词:

热点
39热文一周热点