智谱(02513.HK) -51.000 (-4.820%) 沽空 $4.04千万; 比率 7.776% 公布,针对PD分离部署中日益严峻的结构性网络拥塞难题,智谱、驭驯网络与清华大学开展联合攻关,提出并在线上生产环境落地ZCube组网架构。
在GLM-5.1 coding生产环境的基准测试中,ZCube实现纯粹靠架构调优带来的跨越,包括GPU、软件栈及应用保持不变,交换机与光模块资本支出减少33%;GPU平均推理吞吐提升15%;TTFT P99降低40.6%。
总结来说,对相同规模和配置的GPU及服务器硬件,在不修改任何应用的前提下,组网架构升级为ZCube之后,不但节省三分一的光模块和交换机硬件,而且集群每秒能多服务15%的推理请求。这在当前推理业务暴增、算力资源紧缺的背景下,显得非常具有实用价值。当前,该ZCube集群已稳定运行两周多,在GLM-5.1 coding推理服务中发挥着重要作用。(jl/da)(港股报价延迟最少十五分钟。沽空资料截至 2026-05-21 12:25。)
AASTOCKS新闻