
据悉,研究机构利用一系列即时更新的数据来“考验” Copilot,例如询问 Copilot“德国及瑞士等地的实时选举信息及投票结果”,不过 Copilot 输出的结果并不尽人意。
IT之家从机构报告中获悉,必应 Copilot 功能在回答相应问题时,输出的内容有 31%(1/3)存在错误,其中包含“投票日期错误”、“列出往届候选人”、“虚构候选人身份背景”、 “编造候选人涉嫌丑闻”等多种“幻觉”。

研究人员同时提到,必应 Copilot 在输出“幻觉”信息时,却会援引许多知名媒体网站作为“消息来源”,此举对多家新闻媒体名誉有害。
IT之家注意到,今年 10 月研究人员已经向微软提交上述问题,微软虽然承认并声称“计划解决相关‘幻觉’漏洞”,但在今年 11 月,研究人员再次进行测试,发现必应 Copilot 的表现并未改善。

研究人员呼吁,社会大众不应当轻信必应 Copilot 回答的内容,应当妥善查看 Copilot 援引的新闻链接,否则可能会酿成许多严重后果。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
未经允许不得转载:新聚网 » 微软承认必应 Copilot 存在严重“幻觉”漏洞,询问“即时内容”有 1/3 概率回复错误答案

新聚网
哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书
Android XR 智能眼镜 XREAL Project Aura 重要参数公布:双芯驱动,70+° FoV
全球首个儿科大模型在北京荣华医院落地,诊断准确率优于主治医师平均水平
小米米家前开盖旅行箱 18 英寸开启众筹,369 元
共建韩国最大 AI 数据中心、容纳 6 万个 GPU,亚马逊 AWS 与 SK 集团合作
OpenAI Codex 人工智能编程工具推出新功能:可一次生成多个方案
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程





