
麻省理工学院计算机科学与人工智能实验室(CSAIL)的一项最新研究指出,这些强大的大型语言模型(LLM)似乎更依赖记忆而不是真正的推理能力。它们在熟悉的任务上表现出色,但在面对新问题时却显得力不从心。
IT之家注意到,研究人员通过对比 AI 在不同任务上的表现得出这一结论。例如,GPT-4 在十进制算术方面表现优异,但在其他进制下却难以应对,类似的现象也出现在棋类游戏和空间推理等领域。研究人员认为,AI 更像是记忆力超群的“鹦鹉”,而非具备真正推理能力的“智者”。
研究结果表明,AI 在训练有素的领域内可以达到甚至超越人类水平,但这更多的是一种“记忆力”的体现。一旦面对全新的挑战,需要真正的推理能力时,AI 的优势便不再明显。
这一发现对 AI 的未来发展提出了新的挑战。虽然 AI 在某些领域已经展现出超越人类的能力,例如自动化大量重复性工作,但在创意、解决复杂问题等方面仍有巨大的提升空间。例如,一些媒体机构尝试用 AI 取代记者,结果却发现 AI 生成的新闻错误百出,反而增加了编辑的工作量。
游戏行业也面临类似的问题,AI 工具虽然能辅助开发过程,但核心创意和游戏体验的打造仍然离不开人类的智慧和创造力。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
未经允许不得转载:新聚网 » 研究:生成式 AI 更像是记忆大师而非推理高手

新聚网
哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书
Android XR 智能眼镜 XREAL Project Aura 重要参数公布:双芯驱动,70+° FoV
全球首个儿科大模型在北京荣华医院落地,诊断准确率优于主治医师平均水平
小米米家前开盖旅行箱 18 英寸开启众筹,369 元
共建韩国最大 AI 数据中心、容纳 6 万个 GPU,亚马逊 AWS 与 SK 集团合作
OpenAI Codex 人工智能编程工具推出新功能:可一次生成多个方案
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程





