# SimpleQA

谷歌AI搜索结果每小时生成数百万错误答案新研究揭示事实准确性问题

据《纽约时报》与初创公司Oumi联合进行的测试显示，谷歌AI Overviews在回答问题时准确率约为90%，意味着每10个答案中约有1个错误。该测试基于OpenAI发布的SimpleQA基准，包含超过4000个可验证问题。数据显示，AI Overviews每日生成数千万个错误答案。尽管准确率在Gemini 3更新后从85%提升至91%，但错误仍普遍存在，例如在回答鲍勃·马利故居成为博物馆的时间和马友友入选古典音乐名人堂等问题时出现事实性错误。该研究引发对AI生成内容可信度的广泛担忧。

2026-04-08 02:06

谷歌AI搜索结果每小时生成数百万错误答案 新研究揭示事实准确性问题

谷歌AI搜索结果每小时生成数百万错误答案新研究揭示事实准确性问题