ChatGPT升级后编造倾向加剧，AI真实与幻象仅一线之隔？-28资讯网—

ChatGPT升级后编造倾向加剧，AI真实与幻象仅一线之隔？

2025-04-24 11:37:23 资讯 250观看

摘要近期，ChatGPT及其同类AI产品的能力进步显著，但用户逐渐意识到这些智能助手有时会提供错误信息，甚至能编造出看似合理的答案，且态度一本正经。根据OpenAI官方数据，在专门用于检测AI“幻觉”的PersonQA测试中，o4-mini的准确率

近期，ChatGPT及其同类AI产品的能力进步显著，但用户逐渐意识到这些智能助手有时会提供错误信息，甚至能编造出看似合理的答案，且态度一本正经。

根据OpenAI官方数据，在专门用于检测AI“幻觉”的PersonQA测试中，o4-mini的准确率低于其前代o1和o3，编造答案的频率更是o1的三倍。而性能更强的o3虽然整体准确率有所提升，但其编造答案的概率也比o1高出两倍。研发团队表示，尽管他们为模型加入了图像分析和联网检索能力，但仍无法解释为何升级后的产品更容易产生不实信息。

值得注意的是，这些新模型展现出了巨大的潜力，如通过照片定位拍摄地点、深度解析网页信息以及构建复杂的逻辑链条。然而，就像脱缰的想象力，它们在推理过程中往往会夹杂虚构内容。OpenAI的工程师们至今未能找到解决这一技术难题的方法。

在实际应用中，o4-mini有时会过早地给出结论，这可能意味着在信息加工过程中存在某种程度的失真。因此，在可预见的未来，对AI输出的审慎核查仍将是一项必要的工作。在追求智能的道路上，真实与幻象之间的界限往往十分微妙。

举报 0收藏 0打赏 0评论 0 更多>同类资讯

极空间AI NAS 焕新系统，离线办公、安全防护全面升级领跑行业在这个数据爆炸的时代，我们每个人都面临着数据存储与管理的难题。手机相册里数万张照片、工作电脑上堆积如山的文档、4K蓝光电影资源的存储需求，以及远程办公对数据协同的要求，传统的本地硬盘和云盘早已力不从心。根据2025年NAS行业报告显示，中国NAS市场规模预计将突04-24

佳明Forerunner 970智能手表现身官网，或将于近期发布？04-24

台积电A14制程曝光：2028年投产，逻辑密度大增20%以上！04-24

微软终解Windows Server 2025开机缓慢、蓝屏等顽疾04-24

微软Word大升级：数据引用更便捷，支持150万字及20文件引用！04-24南宁太古可口可乐生产线焕新升级，经典玻璃瓶汽水全新亮相！04-24OpenAI今夏或推开源语言模型，宽松许可引期待公司计划在今夏初发布该模型，并希望其在推理能力上超越其他同类开源推理模型。据消息人士透露，OpenAI的开源模型将采用“输入文本，输出文本”的模式，并可能允许开发者像最近由Anthropic等公司发布的推理…04-24

中国“羲和二号”2028年探索日地L5点，开启太阳立体探测新篇章04-24

潍柴H/T-2.0高热效率发动机：省油新标杆，开启大马力效率革命04-24

中关村科金与华为云强强联合：发布垂类大模型解决方案，升级智能客服核心产品4月23日,由中关村科金与深圳市人工智能产业协会联合主办“大模型·全连接·新增长——2025大模型技术与应用创新城市论坛” 深圳站成功举行。来自金融、制造、零售等领域的 300 余位专家和代表齐聚一堂,共同探讨大模型如何助力企业连接全球客户,实现新增长。在本次论坛上04-24