阿里巴巴 PAI 发布开源 AgenticQwen 模型:8B 版本通过双数据飞轮实现接近 235B 的性能
2026-04-27 15:18:10
币小二 快讯,4月27日——阿里巴巴的 PAI 团队已发布并开源 AgenticQwen,这是一款面向工业级工具调用应用的小规模代理式语言模型。该模型提供两个版本:8B 和 30B-A3B。通过创新的“双数据飞轮”强化学习框架训练,AgenticQwen 在大幅降低推理成本的同时,实现了接近“万亿级参数规模”的模型层级代理能力。
双数据飞轮机制解决了传统合成数据中的同质化问题。推理飞轮会从模型错误中自动生成更难的变体,而代理式飞轮会将简单的线性工作流 (例如单次预订流程)扩展为带约束的多分支行为树,包含拒绝与对抗条件,模拟真实世界的复杂决策场景。基准测试显示,AgenticQwen-8B 在真实工具环境基准 (TAU-2 和 BFCL-V4) 上得分为 47.4,远超基础 Qwen3-8B (23.8),并接近 Qwen3-235B (52.0)。AgenticQwen-30B-A3B (仅激活 3B 参数) 达到 50.2。
该模型已部署在类似 Manus 的内部生产系统中,端到端推理时间方面显著缩小了与 235B 模型的差距。不过,该模型受原生上下文长度 40K tokens 的限制,这会制约其在深度搜索任务上的表现。
声明:文章不代表币小二观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!