币小二 快讯,4月15日——一项最近发表在《BMJ Open》的研究发现,五个主要的 AI 聊天机器人在约 50% 的案例中提供了有问题的医疗建议,其中接近 20% 的回答被归类为高度有问题。来自美国、加拿大和英国的研究人员使用 10 个问题、覆盖五个健康主题来测试 ChatGPT、Gemini、Meta AI、Grok 和 DeepSeek。

这些聊天机器人在封闭式问题以及诸如疫苗和癌症等主题上表现更好,但在开放式问题以及诸如干细胞和营养等主题上则感到困难。被测试的聊天机器人均未生成完整且准确的参考文献列表。

该研究的作者警告称,面向公众的聊天机器人可能会放大错误信息,因为这些工具并未获许可提供医疗建议,并且可能在缺乏依据的情况下以过度确定的语气呈现有缺陷的答案。