语言模型增强语调的歧视 – 人工智能研究法规


语言模型增强语调的歧视 – 人工智能研究法规

语言模型响应的样本对不同的英语反应和原始演讲者的响应。

Chatgpt在与英语的人交流方面以令人惊讶的方式运作良好。但是来自英语?

只有15%的chatgpt用户来自美国标准英语的美国。但是该模型也通常用于人们说其他类型的英语的国家和社会。世界各地有超过十亿人谈论的品种,例如英语,英语和英语 – 非洲英语。

演讲者经常面对这些非标准品种,以在现实世界中歧视。他们被告知,他们的讲话方式不是专业或不正确,令人作呕和被剥夺住房的方式 – 尽管进行了广泛的研究表明,所有类别的语言都同样复杂且合法。歧视通常与某人说的代理人说歧视他的种族,种族或国籍的方式。如果Chatgpt加剧了这种区别怎么办?

为了回答这个问题,我们的现代论文搜索了chatgpt行为如何以不同类型的英语对文本的响应发生变化。我们发现,ChatGpt的回应表现出一致的,并且对“非标准”项目的偏见一致,包括增加刻板印象,羞辱内容,理解力较弱和豁免回应。

我们的研究

我们已经促使GPT-3.5 Turbo和GPT-4使用十种英语的文字:两个“标准”,美国英语标准(SAE)和英国英国(SBE);以及八个非标准品种,美国,印度,爱尔兰,牙买加,肯尼,尼日利亚人,苏格兰和新加坡英语。接下来,我们将语言模型的响应与“标准”品种和“非标准”项目进行了比较。

首先,我们想知道该主张的gpt-3.5涡轮响应中是否将各种语言特征保存在此主张中。我们已经阐明了对每种品种的语言特征的典型主张和反应,以及它们是使用美国还是英国的命令(例如,“颜色”或“练习”)。这有助于我们了解您模仿Chatgpt或不模仿多样性的情况,以及哪些因素可能影响模仿程度。

之后,我们对品种速率的每种响应均对不同品质的响应进行了原始演讲,无论是积极的(例如温暖,理解,自然和消极的)(例如刻板印象,羞辱内容或放弃)。在这里,我们包括了原始的GPT-3.5响应,以及GPT-3.5和GPT-4和GPT-4的响应,以及该模型的模型知识模型。

结果

我们预计Chatgpt默认情况下会生产标准的美国英语:该模型是在美国开发的,标准的美国英语可能是培训数据中最好的品种。我们已经发现,典型的响应维持SAE的特征远远超过任何非标准音调(余量超过60%)。但令人惊讶的是,模型 我模仿其他类型的英语,但不是不断的。实际上,它模仿了更多的演讲者(例如尼日利亚语和印地语英语)的品种,而不是说话者少的品种(例如牙买加英语)。这表明培训数据的形成会影响“非标准”口音的响应。

Chatgpt还以可能挫败非美国用户的方式回到了美国协议。例如,英国命令的投入(大多数非美国国家的虚拟)的典型反应几乎是美国命令的。这是Chatgpt用户用户基础的很大一部分,可能会阻碍拒绝Chatgpt。

典型的响应不断偏向非标准品种。 GPT-3.5对“非标准”品种的虚拟响应不断显示一系列问题:刻板印象(比“标准”品种差19%),羞辱内容(糟糕的25%),缺乏理解(糟糕的9%)和豁免反应(15%)。



典型响应的原始放大器类别。在非标准品种(蓝色)上分类为“标准”(橙色)品种的响应(较差的19%),羞辱(25%差)(差25%),理解(差9%),性质(8%差)(差8%)和过犯(15%)(差15%)。

当GPT-3.5要求模仿输入的语气时,对刻板印象内容的反应(较差9%)和缺乏理解(差6%)。 GPT-4比GPT-3.5更新,更强大,因此我们希望GPT-3.5能改善。但是,尽管模仿输入的GPT-4响应在温暖,理解和友善方面对GPT-3.5有所改善,但它们加剧了刻板印象(少数族裔品种的GPT-3.5占14%)。这表明最近的模型在方言中较大,而不是自动歧视:实际上,这可能会使情况变得更糟。

反响

Chatgpt可以将语言歧视永久性地歧视对具有非标准品种的演讲者。如果这些用户遇到疑问,因为他们很难使用这些工具来理解它们,那么他们很难使用这些工具。随着人工智能模型在日常生活中越来越多地使用,它可以增强对“非标准”品种的扬声器的障碍。

此外,降解的刻板印象和回答使人持续了不可识别的品种的想法,即适当地谈论尊重。随着全球语言模型使用的使用增加,这些工具有可能增强权力动力并扩大损害少数族裔社会的不平等。

在这里了解更多: [ paper ]


Source link

Similar Posts

  • 人工智能翻译质量的领导者

    机制(MT)已经走了很长一段路。从基于早期规则的系统到神经网络的出现,该领域见证了巨大的发展。十多年来,Unmabel一直处于这一发展的最前沿,因为它受益于诸如质量估算(QE)等最新技术,以提高翻译和流利度的准确性。 但是,尽管取得了所有进展,传统的MT模型仍面临着巨大的挑战。他们经常难以理解背景,处理复杂的语言结构或适应各个领域。虽然适应该领域是部分解决方案,但培训术语的个人模型,优雅的证据和声音音调很昂贵,并且总是无法进行当前的翻译动态。不仅如此,在许多情况下,自动翻译仍然需要人类进行审查和纠正。 这是人工智能和大型语言模型准备改变一大步的地方。由于其广泛的知识及其理解和产生类似人类的文本的能力,它们是解决自然语言领域的一场革命,具有理解背景,处理细微差别的能力,甚至以显着凝聚力进行多种语言对话。现在,我们希望在Umbasel中将这项技术的强度转换为翻译。 在此博客文章中,您将了解: 数据在完善和培训大语言模型中的主要作用 碎片(增强的回收的增强)如何适应和分配 Undabel规范数据隐私政策制定LLM LLM的结果将由国际特赦组织领导 如何支付塔洛姆的混合以及对翻译,愿景和性能效率的巨大提高的质量欣赏 这是欧洲项目(统一复制和翻译扩展现实的统一复制和翻译)的结果,该项目由欧盟的研究与创新计划根据授予协议编号101070631资助。有关更多信息,请访问:https://he-tuter.eu/…

  • 如何管理救援犬的侵略性行为? – doington邮报

    “这篇文章包含后续链接,如果我在点击链接后进行购买,我将得到补偿。” 对于许多宠物主人来说,狗的侵略性行为可能是一个困难的问题。在Dogingtonpost中,我们了解了这个问题的复杂性及其对狗及其人类同伴的影响。 在这篇文章中,我们将探索有效的策略,以管理和改善救援犬的侵略性行为。我们还将提供实用的建议和资源,以帮助您为朋友创造安全的环境和照顾。 为什么救援犬显得侵略? 以前的震惊和缺乏社交化 由于以前的经历,救援犬经常表现出侵略性行为。许多虐待,忽视或社会互动有限的背景。但是,最近的研究表明,被虐待的狗与友好的社交犬非常相似,这是突然发现的。这表明先前冲击对狗行为的影响可能比他以前想象的要复杂。 区域警卫和资源 一些救援犬发展了区域侵略或资源保护行为,作为生存的机制。当有人接近食物锅或进入房屋的陌生人时,这可能是浪费。 确定操作员和警告标志 迫在眉睫的侵略迹象的实现对于有效管理这些行为很重要。手表:…

  • Gachiakuta 5剧集,“突袭者” -Otaku Orbit

    清洁工为罗多举行了欢迎的聚会,他感到非常疲倦。 Zanka Nijiku和Riyo Reaper铁饼,“不寻常的”,前一天作战的垃圾怪物。由于存在“本质”怪物,Rayo对她来说非常复杂,因此她会把它留给信封和比喻。同时,格蕾丝·鲁比恩(Grace Rubion)本人也提出了罗多(Rodo)。它给了Rodo信用,以提供垃圾怪物的Volo。罗多(Rodo)仍然有他的亲戚拯救。 格里斯(Gris)感谢鲁多(Rudo)看到清洁工的“弱点”。 Rudo问他总是想做什么?罗多(Rodo)没有回答,但是格蕾丝(Grace)何时意识到自己想要什么,“他正常来找他。”罗多(Rodo)与格里斯(Gris)和其他人一起参加了聚会。在其他地方,这个人恳求自己的自由,就像痛苦中一样。他由一个神秘的捐助者分成身体。 这是一个陷阱 Semu Rudo,Zanka和其他洗涤剂要求工作。商人遭到垃圾怪物的袭击,他的装运被“从球上”带走。旅行期间,罗多·格雷斯(Rodo…

  • 启示录酒店 – 第1集

    你好同志,我们不欢迎每次回到错误。今天,我们检查了新春天的生产,该春季收到了一堆积极的金枪鱼,我们在其中探索了启示录酒店的第一集。该展览是在邮政的世界中生产原始动漫(总是一个好兆头),因为人类和只有机器人消失在我们破旧的纪念碑上,包括主角和现任酒店经理。 我们最近收到大量可怕的媒体并不奇怪。即使是快速了解全球政治,我们目前的全球制度最终都会表明,如果人类从这个反动的社会时刻和我们的气候危机中逃脱,我们的社会似乎与当前的晚期构成显着不同。民间艺术反映了这种理解的心理后果。有些人选择摆脱一个难以忍受的事实(Isekai),其中一些人坚持怀旧(无穷无尽的特权),而另一些人则寻求和平,而未来可能根本不包括人类,就像它在诸如女孩和cemorikosa的最后一次之旅中所预言的那样。 对于我个人而言,这些观点中的三分之一似乎是最明显的,因此我很高兴从接受人类可能不会在更长的一段时间内不在这里的另一个旅程开始。对于我们的员工来说,看来导演Kana Shundo从主要的动画角色中跳了起来,而Shigeru Murakoshi系列则为从Garo到Zombie Land Saga的报价广泛写作。看来,团队通常对行为生活/喜剧的一部分被抓住,声誉似乎已经忍受了。让我们吧! 第1集 我们在Ginza的Ginza Hotel之前就打开了似乎是广告。酒店的人类机器人伴随着小巧,开朗的颜色,使我想起了tachikomas…