反讽：顶尖人工智能会议NeurIPS的论文中发现由AI捏造的引文-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：https://techcrunch.com/2026/01/21/irony-alert-hallucinated-citations-found-in-papers-from-neurips-the-prestigious-ai-conference/

原文作者：Julie Bort

人工智能检测初创公司GPTZero扫描了上个月在圣地亚哥举行的著名神经信息处理系统大会（NeurIPS）所录用的全部 4,841篇论文，该公司告诉TechCrunch，他们发现了51篇论文中存在共计100条被证实是虚假的、由AI捏造的引文。

被NeurIPS录用一篇论文是人工智能领域一项值得写在简历上的成就。考虑到这些是人工智能研究领域的顶尖人才，人们可能会认为他们会为了撰写引文这一“灾难性无聊”的任务而使用大型语言模型（LLM）。

因此，这一发现存在许多需要注意的地方：在51篇论文中发现100条被证实的虚假引文，在统计学上并不具有显著意义。每篇论文都有几十条引文。因此，在数万条引文中，这在统计学上可以视为零。

同样重要的是要注意，不准确的引文并不会使论文的研究失效。正如NeurIPS告诉《财富》杂志（该公司率先报道了GPTZero的研究）所说：“即使有1.1%的论文因为使用LLM而包含一处或多处不正确的引用，论文本身的内容也不一定被作废。”

但话又说回来，虚假的引文也绝不是什么小事。NeurIPS一直以其在机器学习和人工智能领域的“严谨的学术出版”而自豪，它表示。而且每篇论文都经过多人的同行评审，评审人员被指示要标记出AI的幻觉内容。

引文在研究人员那里也算是一种“货币”。它们被用作衡量研究人员工作对其同行影响力的职业指标。当AI捏造引文时，就会稀释它们的价值。

考虑到涉及的论文数量巨大，没有人可以指责同行评审人员没有发现少数几条由AI伪造的引文。GPTZero也很快指出了这一点。这项调查的目标是提供关于AI垃圾信息如何通过“论文提交的洪水”悄悄潜入的具体数据，这种洪水已经“使这些会议的审稿流程不堪重负”，该公司在其报告中称。GPTZero甚至提到了2025年5月的一篇题为《AI会议同行评审危机》的论文，该论文讨论了包括NeurIPS在内的顶级会议面临的问题。

然而，为什么研究人员自己不能对LLM的工作准确性进行事实核查呢？他们肯定知道自己工作所使用的实际论文列表。

整件事真正指向了一个巨大的讽刺性启示：如果世界上最顶尖的AI专家，将声誉押在工作成果上，都无法确保他们对LLM的使用在细节上是准确的，这对我们其他人意味着什么呢？

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。

目录CONTENT

反讽：顶尖人工智能会议NeurIPS的论文中发现由AI捏造的引文

评论区