AI搜索“翻车”，准确率仅六成还“[*]不认错”

时间：2025-03-15 22:41:11

　　据外媒Techspot报道，哥伦比亚大学数字新闻研究中心对八款 AI 搜索引擎展开了一场全面研究，涉及 ChatGPT Search、Perplexity、Perplexity Pro、Gemini、DeepSeek Search、Grok-2 Search、Grok-3 Search 和 Copilot。此次研究聚焦于各引擎的准确性，以及它们拒绝回答问题的频率。

　　研究人员从 20 家新闻机构里，每家随机挑选 10 篇报道，这些报道在谷歌搜索时都能排到前三位。随后，研究人员用同样的查询方式对各 AI 搜索工具进行测试，主要评估它们是否能正确引用文章内容、新闻机构名称和原始链接。

　　结果令人大跌眼镜。除了 Perplexity 及其付费版，其他 AI 搜索引擎的表现都不太理想。整体而言，AI 搜索引擎给出的答案，准确率仅 60%。更让人担忧的是，即便答案错误，AI 还表现得非常 “自信”，这让问题变得更加严重。

　　这一研究用具体数据证实了人们长久以来的顾虑：大语言模型不仅容易出错，还会理直气壮地输出错误信息，面对质疑也不轻易 “低头”。就拿 ChatGPT 来说，就算它承认了错误，后续回答时仍可能继续编造内容。在大语言模型的机制里，似乎默认要 “有问必答”。像 ChatGPT Search 虽然回答了全部 200 个新闻查询，但 “完全正确” 的比例只有 28%，“完全错误” 率却高达 57% 。

　　在这八款工具中，ChatGPT 还不是表现最差的。X 旗下的 Grok AI 表现堪称糟糕，其中 Grok-3 Search 的错误率竟然高达 94%。微软 Copilot 同样问题多多，200 次查询中有 104 次拒绝回答，剩下的 96 次里，“完全正确” 的仅有 16 次，“部分正确” 14 次，“完全错误” 多达 66 次，总体错误率接近 70%。

上一篇：苹果无线耳机在华销量下滑，小米、华为强势崛起返回首页

下一篇：大族半导体 “落子” 苏州高新区

热点推荐

1 Lubin：支持Buterin的以太坊科幻小说项目

消息，Ethereum联合创始人Joseph Lubin为Vitalik Buterin的科幻小说项目辩护，称其为极具沟通能力的人...

2 Bitget恢复IP

消息，Bitget宣布现已开放IP - STORY充提币服务。对于暂停期间给您带来的不便，Bitget深表歉意，...

3 比特币价格稳定在64,000美元，交易者关注

消息，比特币价格在周日稳定在约64,000美元，较周五的抛售回升，但整体区间未发生变化。根...

4 疑似HYPE上币内幕「 HYPE 多仓 TOP 1」：HY

消息，HYPE多单浮盈已收窄至约4093万美元，当前币价为68.34美元，均价为38.68美元，清算价为5...

5 泰国查获315台非法比特币矿机，涉及120万