📢 转载信息
原文作者:Benj Edwards, Ars Technica
周六,科技企业家Siqi Chen 发布了一个针对Anthropic的Claude Code AI助手的开源插件,该插件指示AI模型停止以AI模型的口吻写作。
这个名为“Humanizer”(人性化器)的简单提示插件,向Claude提供了一份包含24种语言和格式模式的列表,这些模式被维基百科编辑们列为聊天机器人写作的明显特征。Chen将该插件发布在GitHub上,截至周一,它已获得了超过1600个星标。
Chen在X上写道:“维基百科去整理了一份详细的‘AI写作迹象’列表,这真是太方便了。方便到你只需要告诉你的LLM……别那样做就行了。”
该源材料来自WikiProject AI Cleanup,这是一个自2023年底以来一直在搜寻AI生成文章的维基百科编辑小组。法国维基百科编辑Ilyas Lebleu创立了这个项目。志愿者们已经标记了超过500篇文章以供审查,并在2025年8月发布了一份他们持续看到的模式的正式列表。
Chen的工具是Claude Code(Anthropic基于终端的代码助手)的“技能文件”(skill file),它包含一个Markdown格式的文件,其中添加了一系列书面指令(你可以在这里查看),这些指令会被附加到输入给驱动该助手的大型语言模型的提示中。与普通的系统提示(system prompt)不同,技能信息采用标准化格式,Claude模型经过微调,能比纯粹的系统提示更精确地解释这些信息。(自定义技能需要付费的Claude订阅,并且需要开启代码执行功能。)
但是,正如所有AI提示一样,语言模型并不总是能完美遵循技能文件,那么Humanizer真的有效吗?在我们有限的测试中,Chen的技能文件确实让AI代理的输出听起来不那么精确、更随意,但它可能存在一些缺点:它不会提高事实准确性,甚至可能损害编码能力。
特别是,Humanizer的一些指令可能会根据任务的不同而让你走偏。例如,Humanizer技能中包含这样一行:“要有观点。不要只是报告事实——对事实做出反应。‘我真的不知道该如何看待这件事’比中立地列出利弊更像人类。”虽然不完美似乎很“人性化”,但如果你使用Claude来撰写技术文档,这类建议可能帮不上忙。
尽管存在这些缺点,但颇具讽刺意味的是,网络上最常被引用的用于检测AI辅助写作的规则集之一,现在可能反而帮助一些人规避了检测。
识别模式
那么AI写作是什么样子的呢?维基百科的指南非常具体,并提供了许多例子,但为了简洁起见,我们只在这里举一个例子。
根据该指南,一些聊天机器人喜欢用“标志着一个关键时刻”(marking a pivotal moment)或“是……的证明”(stands as a testament to)之类的短语来渲染它们的主题。它们的写作风格像旅游宣传册,称风景“令人惊叹”,并将城镇描述为“坐落于”风景区内。它们喜欢在句子末尾加上“-ing”短语来显得更具分析性:“象征着该地区对创新的承诺。”
为了规避这些规则,Humanizer技能指示Claude用平实的描述替换夸张的语言,并提供了以下转换示例:
之前: “加泰罗尼亚统计局于1989年正式成立,标志着西班牙地区统计学发展中的一个关键时刻。”
之后: “加泰罗尼亚统计局于1989年成立,旨在收集和发布地区统计数据。”
Claude会读取这些指令,并作为一个模式匹配机器尽力创造出符合当前对话或任务上下文的输出。
AI写作检测为何会失效
尽管维基百科编辑们创建了一套自信的规则集,但正如我们之前写过的,AI写作检测器之所以不能可靠工作,是因为人类写作中并没有什么内在独特之处可以可靠地将其与LLM写作区分开来。
一个原因是,尽管大多数AI语言模型倾向于某些类型的语言,但它们也可以被提示避开这些语言,就像Humanizer技能所做的那样。(尽管有时这非常困难,正如OpenAI在其与em dash(长破折号)的多年斗争中发现的那样。)
此外,人类也可能以类似聊天机器人的方式写作。例如,本文很可能包含一些即使是由专业作家撰写的、会触发AI检测器的“AI写作特征”——特别是如果我们使用哪怕一个长破折号的话——因为大多数LLM都是从网上抓取的专业写作示例中学到了写作技巧。
沿着这个思路,维基百科指南中有一个值得注意的注意事项:虽然该列表指出了未经修改地使用ChatGPT等工具的一些明显迹象,但它仍然是基于观察,而非铁律。页面上引用的2025年的一篇预印本研究发现,重度使用大型语言模型的用户能以大约90%的准确率正确识别出AI生成的文章。这听起来很不错,直到你意识到有10%是误报,这足以为了检测AI垃圾内容而可能剔除一些优质的写作。
从更宏观的角度看,这可能意味着AI检测工作需要比标记特定的措辞更深入,而需要更多地深入探究作品本身的实质性事实内容。
本文最初发表于 Ars Technica。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区