腾讯 Hunyuan 揭示 Stem 稀疏注意力算法,将 128K 上下文下首个 Token 延迟降低 3.7 倍
2026-06-05 22:30:59
据 Guru Club 称,6 月 5 日腾讯 Hunyuan 发布了 Stem 稀疏注意力算法,该算法被顶级机器学习会议 ICML-26 接纳。该算法通过 Token Position Decay(TPD)和 Output-Aware Metric(OAM),在 25% 预算下实现接近无损的准确率;并在结合 HPC 算子后,当上下文长度为 128K 时将首个 token 延迟降低 3.7 倍。
声明:文章不代表币小二观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!