据外媒Techspot报道,哥伦比亚大学数字新闻研究中心对八款 AI 搜索引擎展开了一场全面研究,涉及 ChatGPT Search、Perplexity、Perplexity Pro、Gemini、DeepSeek Search、Grok-2 Search、Grok-3 Search 和 Copilot。此次研究聚焦于各引擎的准确性,以及它们拒绝回答问题的频率。
研究人员从 20 家新闻机构里,每家随机挑选 10 篇报道,这些报道在谷歌搜索时都能排到前三位。随后,研究人员用同样的查询方式对各 AI 搜索工具进行测试,主要评估它们是否能正确引用文章内容、新闻机构名称和原始链接。
结果令人大跌眼镜。除了 Perplexity 及其付费版,其他 AI 搜索引擎的表现都不太理想。整体而言,AI 搜索引擎给出的答案,准确率仅 60%。更让人担忧的是,即便答案错误,AI 还表现得非常 “自信”,这让问题变得更加严重。
这一研究用具体数据证实了人们长久以来的顾虑:大语言模型不仅容易出错,还会理直气壮地输出错误信息,面对质疑也不轻易 “低头”。就拿 ChatGPT 来说,就算它承认了错误,后续回答时仍可能继续编造内容。在大语言模型的机制里,似乎默认要 “有问必答”。像 ChatGPT Search 虽然回答了全部 200 个新闻查询,但 “完全正确” 的比例只有 28%,“完全错误” 率却高达 57% 。
在这八款工具中,ChatGPT 还不是表现最差的。X 旗下的 Grok AI 表现堪称糟糕,其中 Grok-3 Search 的错误率竟然高达 94%。微软 Copilot 同样问题多多,200 次查询中有 104 次拒绝回答,剩下的 96 次里,“完全正确” 的仅有 16 次,“部分正确” 14 次 ,“完全错误” 多达 66 次,总体错误率接近 70%。
消息,麻吉黄立成在Hyperliquid平台上增持ETH多单900枚,约合2079840美元,当前持仓规模为2979384...
2 德副总理:德国不需要特朗普的“指点”德国副总理兼财政部长克林拜尔在5月1日于北威州贝格卡门市举行的活动上表示,德国不需要特...
3 Coinglass:以太坊面临约8.74亿美元多头清算消息,据数据显示,以太坊多头在价格跌破约2206美元时面临约874万美元的清算风险,而空头在...
4 比特币突破78000美元,短期内清算超3000万消息,最近比特币价格突破78000美元,过去一小时内清算超过3000万美元的空头仓位。...
5 Riot Platforms:第一季度数据中心收入达3消息,Riot Platforms报告称,第一季度数据中心收入为3320万美元,占其总收入1.672亿美元的约20...
6 美联储卡什卡利:海峡长期关闭可能危及消息,美联储官员卡什卡利表示,海峡长期关闭带来的价格冲击可能会危及通胀预期,因此需...
7 美国防部与7家AI公司达成协议消息,美国国防部今天发声明称,已与7家领先的人工智能公司达成协议,分别是SpaceX、OpenAI、...
8 ZEC最大空头:CL空单增持10174.50枚消息,ZEC最大空头CL空单增持10,174.50枚,约合1,086,247.65美元,持仓规模达到15,179,643.08美元,均...
9 Riot Platforms公布2026年Q1营收1.67亿美元,首消息,加密矿企Riot Platforms公布2026年第一季度营收为1.67亿美元,其中数据中心业务收入3320万美...
10 KuCoin支持PHIL代币交换并更名为AKITA消息,KuCoin宣布将支持PHIL代币的交换,并更名为AKITA。PHIL到AKITA的代币交换将自动完成,具体...
成都来彰科技 蜀ICP备2025134723号-1
资讯来源互联网,如有版权问题请联系管理员删除。