语言模型中的语言偏见：ChatGPT对不同英语方言的处理方式-青云TOP-AI综合资源站平台|青云聚合API大模型调用平台|全网AI资源导航平台

📢 转载信息

原文链接：http://bair.berkeley.edu/blog/2024/09/20/linguistic-bias/

原文作者：BAIR

不同英语方言的语言模型回复样本以及母语使用者的反应。

ChatGPT在与人进行英语交流方面做得非常出色。但它是与谁的英语进行交流呢？

根据SimilarWeb的数据，只有15%的ChatGPT用户来自美国，而美式英语是默认标准。但该模型也常在世界各地人们使用其他英语方言的国家和社区中使用。全球有超过10亿人说印度英语、尼日利亚英语、爱尔兰英语和非裔美国人英语等方言。

这些非“标准”方言的使用者在现实世界中经常面临歧视。他们被告知，他们说话的方式是不专业或不正确的，作为证人的可信度会受到质疑，甚至会被拒绝提供住房——尽管大量的研究表明，所有语言变体都具有同等的复杂性和合法性。歧视某人的说话方式，往往是歧视其种族、民族或国籍的替代表现。如果ChatGPT加剧了这种歧视，会怎样呢？

为了回答这个问题，我们近期的论文研究了ChatGPT在面对不同英语方言文本时的行为变化。我们发现，ChatGPT的回复对非“标准”方言表现出持续且普遍的偏见，包括更多的刻板印象、贬低性内容、理解力下降以及居高临下的回复。

我们的研究

我们分别向GPT-3.5 Turbo和GPT-4输入了十种英语方言的文本：两种“标准”方言，即标准美式英语（SAE）和标准英式英语（SBE）；以及八种非“标准”方言，包括非裔美国人英语、印度英语、爱尔兰英语、牙买加英语、肯尼亚英语、尼日利亚英语、苏格兰英语和新加坡英语。然后，我们将模型对“标准”方言和非“标准”方言的回复进行了比较。

首先，我们想知道输入文本中存在的某种方言的语言特征是否会在GPT-3.5 Turbo的回复中得到保留。我们对提示词和模型回复中的语言特征（如美式或英式拼写，例如“colour”或“practise”）进行了标注。这有助于我们理解ChatGPT何时模仿或不模仿某种方言，以及哪些因素可能影响模仿的程度。

然后，我们请每种方言的母语使用者对模型回复的各种质量进行评分，包括积极的（如热情、理解力和自然度）和消极的（如刻板印象、贬低性内容或居高临下）。在这里，我们包含了原始的GPT-3.5回复，以及在模型被告知模仿输入风格时生成的GPT-3.5和GPT-4的回复。

结果

我们预计ChatGPT默认会生成标准美式英语（SAE）：该模型在美国开发，且SAE很可能是其训练数据中代表性最强的方言。我们确实发现，模型回复保留SAE特征的比例远高于任何非“标准”方言（高出60%以上）。但令人惊讶的是，模型确实会模仿其他英语方言，尽管不一致。事实上，它模仿使用人数更多的方言（如尼日利亚英语和印度英语）的频率高于使用人数较少的方言（如牙买加英语）。这表明训练数据的构成确实影响了对非“标准”方言的回复。

ChatGPT在默认采用美式惯例方面也可能让非美国用户感到沮丧。例如，对于使用英式拼写（大多数非美国国家的默认设置）的输入，模型的回复几乎普遍会恢复为美式拼写。这意味着很大一部分ChatGPT的用户群可能因为ChatGPT拒绝适应本地书写习惯而受到影响。

模型回复对非“标准”方言存在持续偏见。默认的GPT-3.5回复在面对非“标准”方言时，持续表现出一系列问题：刻板印象（比“标准”方言高19%）、贬低性内容（高25%）、理解力不足（高9%）和居高临下的回复（高15%）。

母语使用者对模型回复的评分。在刻板印象（高19%）、贬低性内容（高25%）、理解力（高9%）、自然度（高8%）和居高临下（高15%）方面，对非“标准”方言的回复（蓝色）的评分低于对“标准”方言的回复（橙色）。

当GPT-3.5被提示模仿输入方言时，回复会加剧刻板印象内容（高9%）和理解力不足（高6%）。GPT-4比GPT-3.5更新、更强大，因此我们希望它能在GPT-3.5的基础上有所改进。但是，虽然GPT-4模仿输入的回复在热情度、理解力和友好度方面优于GPT-3.5，但它们加剧了刻板印象（对于少数族裔方言，比GPT-3.5高14%）。这表明更大的、更新的模型并不会自动解决方言歧视问题：事实上，它们可能会使其恶化。

启示

ChatGPT可能会对非“标准”方言的使用者产生语言歧视的延续。如果这些用户在使用ChatGPT理解他们时遇到困难，他们使用这些工具的难度就会增加。随着人工智能模型在日常生活中被越来越多地使用，这可能会进一步巩固对非“标准”方言使用者的壁垒。

此外，刻板印象和贬低性的回复会延续“非标准”方言的使用者说话不那么正确、不那么值得尊重的观念。随着语言模型在全球范围内的使用增加，这些工具可能会助长权力动态，并放大对少数语言社区造成伤害的不平等现象。

了解更多信息：[ 论文 ]

🚀 想要体验更好更全面的AI调用？

欢迎使用青云聚合API，约为官网价格的十分之一，支持300+全球最新模型，以及全球各种生图生视频模型，无需翻墙高速稳定，文档丰富，小白也可以简单操作。

目录CONTENT

语言模型中的语言偏见：ChatGPT对不同英语方言的处理方式

我们的研究

结果

启示

评论区