Artificial Analysis 今天发布了新的 Coding Agent Index,用于评估当 AI 模型与智能体框架结合时在关键基准测试中的表现,包括 SWE-Bench-Pro-Hard-AA、Terminal-Bench v2 和 SWE-Atlas-QnA。在此次评估中,智谱 GLM-5.1 在开源模型中排名第一,展现了在真实场景下的代码智能体案例中领先的性能。