
作为人类沟通交流、产生共鸣的关键,心理状态能力(也称心智理论)对人类的社交互动来说非常重要。该论文的第一作者 —— 德国汉堡-埃彭多夫大学医学中心的 James W. A. Strachan 与同事及合作者一起,选择能测试心理理论不同方面的任务,包括发现错误想法、理解间接言语以及识别失礼等。
IT之家注:该团队选用了 GPT 和 LLaMA2 模型进行试验,并与 1907 人进行对比。
结果显示,GPT 模型在识别间接要求、错误想法和误导的表现能达到有时甚至超越人类平均水平,而 LLaMA2 的表现逊于人类水平;在识别失礼方面,LLaMA2 强于人类,但 GPT 表现不佳。
据中新社报道,该作者表示,LLaMA2 的成功被证明是因为回答“偏见程度”较低,并非真的对失礼敏感,GPT“表现不佳”则是因为对坚持结论具有“超保守”的态度,而非推理错误。
IT之家附论文地址:《Testing theory of mind in large language models and humans》
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
未经允许不得转载:新聚网 » 《自然》杂志研究:AI 追踪他人心理状态能力与人类相当或超越人类

新聚网
哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书
Android XR 智能眼镜 XREAL Project Aura 重要参数公布:双芯驱动,70+° FoV
全球首个儿科大模型在北京荣华医院落地,诊断准确率优于主治医师平均水平
小米米家前开盖旅行箱 18 英寸开启众筹,369 元
共建韩国最大 AI 数据中心、容纳 6 万个 GPU,亚马逊 AWS 与 SK 集团合作
OpenAI Codex 人工智能编程工具推出新功能:可一次生成多个方案
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程





