📢 转载信息
原文链接:https://www.wired.com/story/ai-americanizer-end-accents/
原文作者:Sheon Han
这一切的开端,正如这些事情常有的那样,源于一条Instagram广告。“如果你是移民,没人会告诉你,口音歧视是真实存在的,”视频中的一位女士说道。她自己的口音略带东欧风味——如此微妙,我得反复听了几遍才注意到。
这条广告是为BoldVoice做的宣传,这是一款由人工智能驱动的“口音训练”应用。点击几下,我就进入了它的“口音神谕(Accent Oracle)”,该工具承诺能猜出我的母语。在我朗读了一长串句子后,算法宣布:“我的朋友,你的口音是韩语。”这让我有点得意,但又感到印象深刻。事实上,我就是韩国人。
我在美国生活了十多年,我的英语不仅流利,可以说是超级流利——仅以我的发音来说,可能就超过了全国平均水平两个标准差。但这仍然不意味着“母语者”。我学习英语的时间太晚了,错过了获得母语口音的关键时期。这是一个区别,根据不同的时代,可能会带来某些复杂的问题。在《士师记》中,基列人据说用“shibboleth”一词来识别并屠杀逃跑的以法莲人,因为后者无法正确发出sh这个音,而是说成“sibboleth”。1937年,多米尼加独裁者拉斐尔·特鲁希略(Rafael Trujillo)下令处死任何无法用西班牙语说出perejil(欧芹)一词的海地人,这就是所谓的“欧芹大屠杀”。
因此,当“口音神谕”继续听我说话时,我感到了巨大的风险——它有时给我打89%(“轻微口音”),另一次是92%(“母语或接近母语”)。这种差异令人不安。在糟糕的日子里,我可能会被屠杀。为了提高我的生存几率,我注册了一个为期一周的免费试用。
口音本身就带有一种“媒介即信息”的特质。如何说话往往比说了什么更能揭示关于你的出身、阶层、教育、兴趣等方面的信息。在大多数社会中,语音的精通会成为一种社会资本。
就像对待其他一切一样,人工智能现在也瞄准了口音。像Krisp和Sanas这样的公司,为呼叫中心工作人员提供实时的口音“中和”服务,将菲律宾客服人员的声音打磨成对俄亥俄州客户来说更悦耳的版本。反AI阵营的即时反应是,这是一种“数字洗白”,是对帝国主义的、单一的英语的投降。这通常被定性为一个种族问题,也许是因为这些服务的广告中出现了有色人种,而呼叫中心位于印度和菲律宾等地。
但这未免过于草率了。为了社会优势而调节言语是一个古老的故事。还记得乔治·伯纳德·肖的《卖花女》(Pygmalion)——及其音乐剧改编版《窈窕淑女》(My Fair Lady)——都围绕着亨利·希金斯改造伊莱扎·杜利特尔的伦敦东区口音展开。就连著名的德国哲学家约翰·戈特利布·费希特(Johann Gottlieb Fichte)在搬到耶拿时也抛弃了他的萨克森口音,因为他担心如果听起来像乡下人,人们就不会认真对待他。
在糟糕的日子里,我可能会被屠杀。
但这绝不是历史的遗迹。英国2022年的一项研究发现,“口音声望等级制度”依然存在,并且自1969年以来几乎没有变化,四分之一的在职成年人报告了某种形式的口音歧视,近一半的受访者表示他们在社交场合被嘲笑或针对。
在Hacker News上一个关于BoldVoice启动的讨论串中,一位评论者写道:“我宁愿努力创造一个口音无关紧要的世界,也不愿去纠正口音。”嗯,去告诉那些在美国摸索于beach(海滩)和bitch(婊子)或coke(可乐)和cock(公鸡)之间危险语音鸿沟的无数韩国人吧。那条网络评论是典型的伪善陈词滥调,那种只有母语者或对非母语者每天面临的屈辱视而不见的人才能悠然自得地摆出的道德制高点。
此外,最严厉的评判并不总是来自母语者。在英语作为第二语言(ESL)的课堂上以及移民群体中,同化程度的微妙等级制度常常上演,口音可以区分出更安顿下来的人和刚抵达的人。“所有口音都是平等的”在语言学上是正确的,但在社会学上却是错误的。
人们为什么会有口音?一方面,一种语言的音素单元——它的音位——与另一种语言的音位并不完全对应。一种语言的声音目录可以只有11个音位,也可以有超过100个(如以搭嘴音闻名的南非的Taa语)。英语大约有44个,而标准韩语也有相似的40个。但许多音素在“翻译”中会丢失。韩国人在th音上很吃力,大脑通常会将其替换为d或s。反之,英语使用者则会在像eu(으)这样的元音上犯难,这种音在英语的音位系统中并不存在。(这也是我将我的韩文名字Seung Heon简化为Sheon——发音像Sean——的原因之一。)
在诊断之后,BoldVoice为我标记了一些“首要关注领域”:th音(毫不意外);最终辅音的清音化,比如did中的d发成了dit;以及拉长seat中的ee元音,使其不至于塌缩成sit中的短i音。
那么,我的口音改变了吗?我永远不会知道。我只坚持了三节课。在家对着手机重复“think, thought, thirty”的屈辱感有点荒谬,让我想起我曾在镜子前笨拙地模仿YouTube上的舞蹈动作度过的某个悲伤的夜晚。
也许当我第一次学习英语时,当我对自己当时可能更厚的口音感到不自在时,我会对这样一个工具更感兴趣。但随着这些年来口音变柔和,它固化成了别的东西:一个方便的听觉速记,能传达我的身份。这款应用的练习让我明白我将要失去什么——磨平我说话中所有外国的棱角,就相当于抹去了那个可被辨识的我独特的声音指纹。
原来,第一个Instagram广告中的那位女士是BoldVoice的联合创始人,她是一位阿尔巴尼亚移民。对于她,以及任何觉得这个应用有用的人,我要说:祝你们好运。我们永远不知道什么时候会被要求读出“欧芹”(parsley)这个词。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。


评论区