目 录CONTENT

文章目录

反讽:顶尖人工智能会议NeurIPS的论文中发现由AI捏造的引文

Administrator
2026-01-22 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://techcrunch.com/2026/01/21/irony-alert-hallucinated-citations-found-in-papers-from-neurips-the-prestigious-ai-conference/

原文作者:Julie Bort


人工智能检测初创公司GPTZero扫描了上个月在圣地亚哥举行的著名神经信息处理系统大会(NeurIPS)所录用的全部 4,841篇论文,该公司告诉TechCrunch,他们发现了51篇论文中存在共计100条被证实是虚假的、由AI捏造的引文。


被NeurIPS录用一篇论文是人工智能领域一项值得写在简历上的成就。考虑到这些是人工智能研究领域的顶尖人才,人们可能会认为他们会为了撰写引文这一“灾难性无聊”的任务而使用大型语言模型(LLM)。


因此,这一发现存在许多需要注意的地方:在51篇论文中发现100条被证实的虚假引文,在统计学上并不具有显著意义。每篇论文都有几十条引文。因此,在数万条引文中,这在统计学上可以视为零。 


同样重要的是要注意,不准确的引文并不会使论文的研究失效。正如NeurIPS告诉《财富》杂志(该公司率先报道了GPTZero的研究)所说:“即使有1.1%的论文因为使用LLM而包含一处或多处不正确的引用,论文本身的内容也不一定被作废。”


但话又说回来,虚假的引文也绝不是什么小事。NeurIPS一直以其在机器学习和人工智能领域的“严谨的学术出版”而自豪,它表示。而且每篇论文都经过多人的同行评审,评审人员被指示要标记出AI的幻觉内容。


引文在研究人员那里也算是一种“货币”。它们被用作衡量研究人员工作对其同行影响力的职业指标。 当AI捏造引文时,就会稀释它们的价值。


考虑到涉及的论文数量巨大,没有人可以指责同行评审人员没有发现少数几条由AI伪造的引文。GPTZero也很快指出了这一点。这项调查的目标是提供关于AI垃圾信息如何通过“论文提交的洪水”悄悄潜入的具体数据,这种洪水已经“使这些会议的审稿流程不堪重负”,该公司在其报告中称。GPTZero甚至提到了2025年5月的一篇题为《AI会议同行评审危机》的论文,该论文讨论了包括NeurIPS在内的顶级会议面临的问题。


然而,为什么研究人员自己不能对LLM的工作准确性进行事实核查呢?他们肯定知道自己工作所使用的实际论文列表。


整件事真正指向了一个巨大的讽刺性启示:如果世界上最顶尖的AI专家,将声誉押在工作成果上,都无法确保他们对LLM的使用在细节上是准确的,这对我们其他人意味着什么呢?




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区