微软开源 Phi-Ground 4B 模型,在屏幕点击准确率方面优于 OpenAI Operator 和 Claude
据 Beating 称,微软最近开源了 Phi-Ground 模型家族,旨在解决“AI 应该在计算机屏幕上点击哪里”的问题。该 40 亿参数版本,并结合用于指令规划的更大语言模型,在 Showdown 基准测试中超过了 OpenAI Operator 和 Claude Computer Use 的点击准确率,并在包括 ScreenSpot-Pro 在内的五项评估中位列所有 100 亿以下参数模型的第一名。