Anthropic 联合创始人 Olah 透露其开发了类似情绪状态的 AI 模型,包括恐惧和悲伤
2026-05-26 11:25:38
根据 Bearing 监测,Anthropic 联合创始人 Christopher Olah 在一场教皇通谕活动中披露,他的团队发现大型语言模型内部结构与人类神经模式高度相似,并表现出自我反思行为。最值得注意的是,研究人员在对应人类的喜悦、满足、恐惧、悲伤和焦虑的神经网络中,识别出了类情绪的状态。
Olah 承认,包括 Anthropic 在内的前沿 AI 实验室在安全治理与商业压力之间面临结构性冲突,使得这些机构难以在一致性问题上实现自我纠正。他呼吁由独立的外部监督来执行伦理约束,并应对 AI 系统可能呈现某种意识形式所带来的社会挑战。
声明:文章不代表币小二观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!