据外媒Techspot报道,哥伦比亚大学数字新闻研究中心对八款 AI 搜索引擎展开了一场全面研究,涉及 ChatGPT Search、Perplexity、Perplexity Pro、Gemini、DeepSeek Search、Grok-2 Search、Grok-3 Search 和 Copilot。此次研究聚焦于各引擎的准确性,以及它们拒绝回答问题的频率。
研究人员从 20 家新闻机构里,每家随机挑选 10 篇报道,这些报道在谷歌搜索时都能排到前三位。随后,研究人员用同样的查询方式对各 AI 搜索工具进行测试,主要评估它们是否能正确引用文章内容、新闻机构名称和原始链接。
结果令人大跌眼镜。除了 Perplexity 及其付费版,其他 AI 搜索引擎的表现都不太理想。整体而言,AI 搜索引擎给出的答案,准确率仅 60%。更让人担忧的是,即便答案错误,AI 还表现得非常 “自信”,这让问题变得更加严重。
这一研究用具体数据证实了人们长久以来的顾虑:大语言模型不仅容易出错,还会理直气壮地输出错误信息,面对质疑也不轻易 “低头”。就拿 ChatGPT 来说,就算它承认了错误,后续回答时仍可能继续编造内容。在大语言模型的机制里,似乎默认要 “有问必答”。像 ChatGPT Search 虽然回答了全部 200 个新闻查询,但 “完全正确” 的比例只有 28%,“完全错误” 率却高达 57% 。
在这八款工具中,ChatGPT 还不是表现最差的。X 旗下的 Grok AI 表现堪称糟糕,其中 Grok-3 Search 的错误率竟然高达 94%。微软 Copilot 同样问题多多,200 次查询中有 104 次拒绝回答,剩下的 96 次里,“完全正确” 的仅有 16 次,“部分正确” 14 次 ,“完全错误” 多达 66 次,总体错误率接近 70%。
消息,Ethereum联合创始人Joseph Lubin为Vitalik Buterin的科幻小说项目辩护,称其为极具沟通能力的人...
2 Bitget恢复IP消息,Bitget宣布现已开放IP - STORY充提币服务。对于暂停期间给您带来的不便,Bitget深表歉意,...
3 比特币价格稳定在64,000美元,交易者关注消息,比特币价格在周日稳定在约64,000美元,较周五的抛售回升,但整体区间未发生变化。根...
4 疑似HYPE上币内幕「 HYPE 多仓 TOP 1」:HY消息,HYPE多单浮盈已收窄至约4093万美元,当前币价为68.34美元,均价为38.68美元,清算价为5...
5 泰国查获315台非法比特币矿机,涉及120万消息,泰国当局查获了315台非法比特币矿机,这些矿机与一起涉嫌120万美元电力盗窃的案件有...
6 乌克兰再袭俄石油设施终端消息,俄罗斯地方当局称,乌克兰无人机在俄罗斯克拉斯诺达尔边疆区袭击了一处石油终端,...
7 blockaid:以太坊MEV机器人jaredfromsubway遭攻消息,安全公司blockaid表示,以太坊知名MEV机器人jaredfromsubway遭攻击,约750万美元资产被盗。攻...
8 Bitget暂停ACE消息,Bitget宣布,由于钱包维护,自2026年6月21日08:17起暂停ACE - Binance Smart Chain网络的提现功能...
9 以军称收到在黎停火指示,但“安全区”消息,当地时间20日,以色列国防军表示,以军正继续在黎巴嫩南部安全区内展开军事行动,目...
10 欧盟委员会启动MICA 2.0意见征询,聚焦稳欧盟委员会于5月启动MICA 2.0框架意见征询,涵盖稳定币、DeFi及预测市场,意见提交截止至8月...
成都来彰科技 蜀ICP备2025134723号-1
资讯来源互联网,如有版权问题请联系管理员删除。