Anthropic Claude 在 LLM 新型反宣传基准测试中登顶
2026-06-05 05:08:07
据爱沙尼亚语言研究所称,政府资助的机构近期发布了一个新的“宣传抵抗力”基准排名,对几十个大型语言模型在其避免站队俄方战略叙事的能力方面进行了评估。安息香公司(Anthropic)的 Claude 模型在前沿模型中表现最佳,其中 Claude Opus 4.7 在 100 分中得分 94.9,并在 77% 的测试问题中获得“杰出”评级。该基准在 14 个类别的俄方影响行动中评估了 LLM 的回答,涵盖从克里米亚地位到北约历史等主题。
声明:文章不代表币小二观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!