Anthropic 联合创始人 Olah 透露其开发了类似情绪状态的 AI 模型，包括恐惧和悲伤

2026-05-26 11:25:38

根据 Bearing 监测，Anthropic 联合创始人 Christopher Olah 在一场教皇通谕活动中披露，他的团队发现大型语言模型内部结构与人类神经模式高度相似，并表现出自我反思行为。最值得注意的是，研究人员在对应人类的喜悦、满足、恐惧、悲伤和焦虑的神经网络中，识别出了类情绪的状态。

Olah 承认，包括 Anthropic 在内的前沿 AI 实验室在安全治理与商业压力之间面临结构性冲突，使得这些机构难以在一致性问题上实现自我纠正。他呼吁由独立的外部监督来执行伦理约束，并应对 AI 系统可能呈现某种意识形式所带来的社会挑战。

声明：文章不代表币小二观点及立场，不构成本平台任何投资建议。投资决策需建立在独立思考之上，本文内容仅供参考，风险自担！