随着生成式人工智能(AI)的快速发展,不少人开始担忧“英语中心主义”将对这一技术带来何种影响。一些观点认为,“英语中心主义”在生成式AI中也广泛存在,可能会强化西方尤其美国在该技术中的垄断地位,甚至形成某种难以逆转的“马太效应”。
“英语中心主义”指的是英语文化、历史和价值观在全球文化、意识形态领域非对称的影响力。其他非英语国家的民众往往需要接受英语和相关文化教育才能融入国际社会,一些语言和文化或在“英语中心主义”的世界被边缘化。在人工智能领域,英语的优势也很明显。据估计,在当前最知名的生成式人工智能应用ChatGPT中,约90%的训练数据是由英文文本构成的。相关研究表明,在美国最主流的几款人工智能大模型中,使用英语的表现通常优于其他语言,特别是在目标识别、问题回答等需要复杂推理的高级任务上。
“英语中心主义”或对生成式AI未来发展带来三方面影响。首先,算法差距和偏见问题。由于多数人工智能训练数据集是基于英语构建,非英语语言和文化的代表性不足。这可能导致使用这些数据集训练出来的人工智能在处理与非英语语言相关的任务时效率低下。另外,多数人工智能使用的语言翻译、情感分析和语音识别系统等自然语言处理技术都是针对英语优化,这导致人工智能算法优化过程中也存在广泛的语言偏见。
其次,研究和应用门槛。英语的优势地位也影响全球人工智能研究、资源和人才的分布。美英的科研机构和大学更容易在这种环境中获得资助和支持,其他一些非英语国家推动规模化研究将面临资金和人才上的更大挑战。这种态势使得开发英语人工智能大模型的成本将低于其他语言。一些小语种可能因为开发成本过高而难以广泛应用。
第三,塑造不公正的技术生态体系。人工智能特别是生成式AI技术在未来将成为一种应用广泛的嵌入式技术。这意味着英语优势的影响将不局限于人工智能领域,而可能向更多领域扩散,进而塑造出一个对于英语更加友好有利的技术生态环境。在这种新技术生态中,语言习惯、逻辑结构与英语相差较大的非英语国家将面临更不利的发展环境。
当然,我们同时也应看到,尽管英语在人工智能和互联网领域的主导作用很强,但人工智能技术也促进了不同文化和语言之间的交流和理解。人工智能显著降低了语言翻译和跨文化交流的门槛,扩大了非英语文化和文学作品的传播度。在一定程度上,新一代人工智能也成为全球化、文明多元化的重要动力。随着人工智能技术进一步发展,这种跨语言转化和应用也可能会加速,从而部分对冲“英语中心主义”带来的影响。
从数字产业发展的历史来看,文化多元化是该产业和生态获取更多价值的重要因素。但从短期来看,国际社会应当采取措施来应对“英语中心主义”带来的偏见和数字鸿沟问题。其一,联合国等全球人工智能的主要治理机构应将应对“英语中心主义”纳入全球治理内容,在人工智能治理中强调多语言支持的必要性,在国际倡议中推动人工智能技术的多文化支持,减少应用和研发中的语言障碍。
其二,非英语国家应加强合作,共同提防和应对“英语中心主义”带来的长期问题,要求美英人工智能领军企业采取有效措施减少算法和语言的偏见问题,要求这些企业增加对非英语国家大模型开发的技术支持,促进这些地区非英语生成式AI的发展。国际社会也应加强生成式AI领域的全球反垄断监管,避免美英人工智能领先企业采取任何非正当竞争手段。(作者是中国现代国际关系研究院美国研究所所长助理)
(责编:赵珊)