📢 转载信息
原文链接:http://bair.berkeley.edu/blog/2024/09/20/linguistic-bias/
原文作者:Berkeley AI Research (BAIR) Blog
英语不同方言的语言模型回复示例和母语使用者对其的反应。
ChatGPT在用英语与人交流方面表现出色。但问题是:是谁的英语?
根据相似网络数据,只有15%的ChatGPT用户来自美国,而标准美式英语(SAE)是那里的默认语言。但该模型在许多其他国家和社区中也普遍使用,那里的居民讲着其他英语方言。全球有超过10亿人使用印度英语、尼日利亚英语、爱尔兰英语和非洲裔美国人英语等方言。
这些非“标准”方言的使用者在现实世界中常常面临歧视。他们被告知他们的说话方式不专业或不正确,其证词被视为不可信,甚至被拒绝住房——尽管大量研究表明,所有语言变体都同等复杂且合法。歧视某人的说话方式,往往是歧视其种族、族裔或国籍的一种替代形式。如果ChatGPT加剧了这种歧视会怎么样呢?
为了回答这个问题,我们近期的论文研究了ChatGPT在回应不同英语方言文本时的行为变化。我们发现,ChatGPT的回复对非“标准”方言表现出持续且普遍的偏见,包括增加刻板印象和贬低性内容、理解能力较差以及带有居高临下的回应。
我们的研究
我们使用十种英语方言分别提示了GPT-3.5 Turbo和GPT-4:两种“标准”方言——标准美式英语(SAE)和标准英式英语(SBE);以及八种非“标准”方言:非洲裔美国人英语、印度英语、爱尔兰英语、牙买加英语、肯尼亚英语、尼日利亚英语、苏格兰英语和新加坡英语。然后,我们将模型对“标准”方言和非“标准”方言的回复进行了比较。
首先,我们想知道输入文本中存在的某个方言的语言特征是否会保留在GPT-3.5 Turbo对该输入的回复中。我们对提示和模型回复中存在的方言语言特征以及它们是否使用了美式或英式拼写(例如,“colour”或“practise”)进行了标注。这有助于我们了解ChatGPT何时模仿或不模仿某种方言,以及哪些因素可能影响模仿的程度。
然后,我们请每种方言的母语使用者对模型回复的各种质量进行评分,包括正面(如热情、理解力和自然度)和负面(如刻板印象、贬低性内容或居高临下)。在这里,我们包含了原始的GPT-3.5回复,以及模型被告知模仿输入风格的GPT-3.5和GPT-4的回复。
结果
我们预计ChatGPT默认会生成标准美式英语:该模型在美国开发,标准美式英语很可能在其训练数据中占比最高。我们确实发现,模型回复保留SAE特征的比例远高于任何非“标准”方言(超过60%的差距)。但令人惊讶的是,模型确实会模仿其他英语方言,尽管并不一致。事实上,它模仿拥有更多使用者的方言(如尼日利亚英语和印度英语)的频率,高于模仿使用人数较少的方言(如牙买加英语)的频率。这表明训练数据的构成影响了模型对非“标准”方言的回复。
ChatGPT在一些方面也默认采用美国惯例,这可能会让非美国用户感到沮丧。例如,对于输入文本中带有英式拼写(大多数非美国国家的默认拼写)的回复,模型几乎总是会恢复为美式拼写。这意味着很大一部分ChatGPT的用户群可能因为ChatGPT拒绝适应当地的书写习惯而受到阻碍。
模型回复对非“标准”方言存在持续的偏见。默认的GPT-3.5回复对非“标准”方言持续表现出一系列问题:刻板印象(比“标准”方言差19%)、贬低性内容(差25%)、理解力不足(差9%)和居高临下的回复(差15%)。
母语使用者对模型回复的评分。在刻板印象(差19%)、贬低性内容(差25%)、理解力(差9%)、自然度(差8%)和居高临下(差15%)方面,对非“标准”方言的回复(蓝色)的评分低于对“标准”方言的回复(橙色)。
当GPT-3.5被提示模仿输入方言时,回复加剧了刻板印象内容(差9%)和理解力不足(差6%)。GPT-4比GPT-3.5更新、更强大,所以我们希望它能在GPT-3.5的基础上有所改进。但是,尽管模仿输入的GPT-4回复在热情、理解力和友好度方面优于GPT-3.5,但它们加剧了刻板印象(与GPT-3.5相比,对少数方言差了14%)。这表明,规模更大、更新的模型并不会自动解决方言歧视问题:事实上,它们可能会让情况变得更糟。
影响
ChatGPT可能会延续对非“标准”方言使用者的语言歧视。如果这些用户在让ChatGPT理解他们方面遇到困难,他们就更难使用这些工具。随着AI模型越来越多地应用于日常生活,这可能会加强对非“标准”方言使用者的障碍。
此外,刻板印象和贬低性的回复会延续一种观念,即非“标准”方言的使用者说话不够规范,且不配受到尊重。随着语言模型在全球范围内使用量的增加,这些工具可能会加剧本已存在的权力结构,并放大对少数语言社区造成伤害的不平等现象。
了解更多信息:[ 论文 ]
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区