mt4自动交易ea编程教程?外汇ea编程教学!

本文来源:《中国翻译》2022年第2期

转自:翻译学通讯

数字化时代机器翻译的风险审视及控制研究

王贇 太原学院/北京师范大学

张政 北京师范大学

摘要:数字化时代以人机多维互联、技术快速迭代和颠覆、产品和服务模式变化等为特征,翻译领域也在经历一场由数字技术触发的变革。在机器翻译逐渐嵌入人类社会、带来福音的同时,也不可避免地对我们的语言及翻译活动中的主体、客体和组织形式等产生负面影响。本文从主体身份异化、客体形式单一化、翻译方式碎片化等角度审视了机器翻译隐含的风险,尝试提出主体能动和客体制约相结合、知识驱动与数据驱动相结合、符号主义与联结主义相结合的风险控制方案,以期为数字化时代人机关系哲学反思与机器翻译优化发展提供思路。

关键词:机器翻译、人工译者、风险

数字化时代又称比特时代或后信息时代,以人机多维互联、技术快速迭代和颠覆、产品和服务模式变化等为特征。尼古拉斯·尼葛洛庞帝(Nicholas Negroponte)在《数字化生存》(Being Digital)一书中描述了人类应用数字技术在数字空间工作、生活和学习的全新生存方式(1995:19-26),对自然语言这种非数值符号进行快速运算和处理已成为数字化时代的必然趋势。数学与语言学相结合催生了计算语言学(computational linguistics),建立形式化的数学模型,用计算机程序来分析和处理自然语言,模拟人的部分乃至全部语言能力(王贇、张政,2020:81)。“由于技术能力的提高,一切都可以翻译。在线交流产生了语言市场,世界各地的语言都可进入交流”(Apter,2006:226),从在线众包翻译、翻译字幕组、译言古登堡等网站到智能手机翻译APP的广泛应用,翻译领域也在经历一场由数字技术触发的变革。翻译处在“广泛普遍性形式与精密普遍性诉求的张力之中,前者推动翻译产业向全球化发展,后者强调文字及用法的难度和复杂度”(Cronin,2013:129)。翻译产业因机器翻译而大规模提高产能,翻译技术成为译员进入市场的必备技能,相关课程也成为翻译人才培养体系不可或缺的组成部分。在机器翻译逐渐嵌入人类社会的同时,也不可避免地对人类语言及翻译活动中的主体、客体和组织形式等产生负面影响。因此,我们有必要分析机器翻译带来的潜在风险,提出针对性的控制方案,以保障数字化时代机器翻译的健康发展。本文论及“机器翻译”的风险,并非常规意义上的直接经济损失或安全事故,而是从技术哲学视角探讨技术对翻译这一特定社会活动中的人类本体、文本客体和翻译活动组织形式可能造成的负面影响及不可逆后果。鉴于此,我们必须正视“机器翻译”在现实世界中引发的风险,审视这些风险对于人类存在有何根本性的影响和意义。

1.机器翻译风险审视

人与翻译技术之间的互动一定程度上将翻译置入“超人类主义”(transhumanism)的知识和文化发展中,“技术的不断发展将会显著提高人类的智力、体力和心理素质”(Cronin,2013:138)。凯文·凯利Kevin Kelly)提出“机器生物化”(1994:145)这一核心观念,技术对作为整体的人(包括人的思维意识)进行模仿,成为一种具有必然发展趋势的“类人”系统,不可避免会挑战人的主体性地位,导致翻译主体界限的模糊。基于技术的翻译活动从机助人译发展到人助机译,甚至全机器翻译,用户很难判断哪一部分译文由机器完成,哪一部分有人工译前、译后干预(任文,2019:49)。机器翻译给人工译者带来的挑战并非个例,而是在数字化时代下人的主体地位普遍现状在翻译领域的体现,也体现了其工具价值被过度放大所造成的人的价值被歪曲的风险。

(一) 译者身份异化

“异化”来自于拉丁文alienus,意为“其他、异类、异乡人”。马克思主义哲学认为,异化是人的生产及其产品反过来统治人的一种社会现象(Marx,etal.1988:72)。马克斯·霍克海默(Max Horkheimer)也认为,技术知识扩大了人的思维和活动范围,同时也伴随着非人化的过程(2004:v)。在异化中,人的个体失去对自己的主宰,被迫进入另一种背离自身的存在状态,主要体现在译者主体身份被消解及人的语言思维能力衰退。

人的实践活动是以改造客观世界为目的、实践主体与客体之间相互作用的过程,必须借助于一定的手段和工具,即实践的中介(马克思主义基本原理概论编写组,2018:58-59)。在翻译活动中,作为译者的人与翻译活动的对象为最常见的主体和客体,机器翻译及使用方法可看作连接主客体的中介,实时在线语言转换功能提高了用户的自主性,但这种自动化与实时性掩盖了“翻译”的本质,形成一种错觉,认为翻译是一种不费力气的替代性转换(Cronin,2013:135)。一些企业过分夸大机器翻译的效果,断言“机器翻译已达人工翻译水准”,如2016年以来国内翻译技术研发企业与语言服务行业从业者之间的冲突,关键原因在于企业在产品推广和销售过程中没有遵循商业伦理的基本原则(韩林涛,2019:55)。这种做法体现了技术决定论思想(张政、王贇,2020:148),将人工译者推到机器翻译及技术发展的对立面,本应处于中介位置的机器翻译挤占了译者的主体地位,使翻译活动中的关系出现对峙或颠倒。

马丁·海德格尔(Martin Heidegger)提出技术时代的“最高的危险”不是对人不利的技术后果,而是人和存在的自身性的损坏、扭曲和丧失(绍伊博尔德,1993:180)。语言是人类大脑最底层结构,也是人类区别于其它生物的基本能力,而翻译是人的理性思维(观察、比较、分析、综合、抽象与概括等)和非理性思维(情感、直觉、幻觉、下意识、灵感等)相结合的行为。人工译者的翻译能力需在大量针对性训练中习得,而机器翻译的“能力”是基于人提供的数据库按一定规则运行。法国生物学家让-巴蒂斯特·拉马克(Jean-Baptiste Lamarck)最早提出“用进废退”的观点,生物在新环境的直接影响下,某些经常使用的器官发达增大,不经常使用的器官就削弱或衰退(1963:113)。机器翻译可以减轻人工译员劳动负荷,但是机械化的翻译过程将损害人类语言和思维能力。正如“萨丕尔—沃尔夫假说(SapirWhorf Hypothesis)”关于语言对思维、文化的决定作用的论述,背景性的语言系统(即语法)不仅是表达思想的一种再现工具,而且是思想的塑造者(张政、王贇,2018:102)。

人类语言最显著的特征为语义的多样性和模糊性,而计算机的工作原理是“非黑即白”的规则运算,计算机产出的译文不一定能符合人类语义逻辑表述,选择计算机翻译模式,也意味着人要以某种方式与计算机运算规则沟通。“译前编辑”通过预先去除自然语言的非规则性表达以靠近计算机语言的程序逻辑,其本质是以抹去人类语言特性为代价的合作方式。做“译后编辑”就像在文字生产流水线上加工机器翻译出的半成品,译者的创造性受到压制。长期处理支离破碎的机器译文,极可能造成语言能力退化,语言审美能力和敏感性降低,导致思维模式化、单一化、机械化,译者自身价值在此过程中被扭曲或贬损。在工具的操控下,个人丧失了否定、批判和超越的能力,以其思维和行为模式不情愿也不可能理解正在发生的事情,形成不受既定理性影响的错误意识,当人被限定在技术生产的界限内,就失去了多样性本质,进入一个单一意义的世界,成为“单向度的人”(Marcuse,1964:148-149)。

(二)译文风格单一化

机器翻译缺少对于语境和文体风格的解 码识别能力,不同系统背后的运算机制大同 小异,输出的译文对文体风格的体现较弱, 更不可能实现“自身的创造性”。下文以《史 蒂夫·乔布斯传》(Steve Jobs: A Biography) 中“We’ve been through so much together and here we are right back where we started 20 years ago – older, wiser – with wrinkles on our faces and hearts”(Isaacson,2011:296)一句为例,对比四种人工译文(林国 丽,2015:79-80)和四种机器译文的风格差异,编码方式为 MT(Machine Translation) 或 HT(Human Translation)加数字 1-4(如 表 1)。本 研 究 按 照 开 发 主 体 所 属 地( 国 内 vs. 国外)和上线时间(10 年以上 vs. 10 年以 内),选择四种代表性在线翻译平台:谷歌翻 译(MT1)①、DeepL(MT2)②、有道翻译 (MT3)③和腾讯翻译(MT4)④,译文文字均 保留原状。此处聚焦于译文风格差异度比较, 暂不对译文正确度进行评价。

本文利用python进行文本相似度计算,依据公式为:,其中和表示相比较的两个文本,表示文本对应的向量(Hank Town,2020)。通过词向量余弦相似度算法,得出每个译文与任一同类(人工翻译或机器翻译)译文的相似度,然后求平均数得出该译文在同类译文中的相似度指数,该指数区间为0~1,表示完全不同和完全相同之间的比例情况。四种人工译文风格差异性较大,相似度在0.38~0.47之间,或随和质朴,或凝练优雅,或古风隽永,体现了人工译者对于文本风格呈现的多样化选择。四种机器译文相似度在0.70~0.78之间,语序和措辞高度接近,译文表达未见明显差异。机器翻译以语义匹配和语法正确为首要目标,在现有算法中难以实现对文体风格的选择和呈现。周领顺认为作为阐释者的译者在翻译之前有必要知晓作者的写作背景、写作意图、写作时代,尤其是个人写作风格,对于准确理解作者用意并进而把握写作风格都有着积极意义(2004:31)。但机器翻译无法像人工译者一样了解作者写作用意,不论哪个机器翻译平台的译文都是高度机械化的产物。乔治·斯坦纳(George Steiner)认为“自然语言松散杂乱的特征是激发人类想象力所不可缺少的因素,语言的歧义、多义、模糊,乃至不符逻辑、违背规则等才是语言精髓之所在”(1975:246)。为了提高准确性,机器翻译势必会极力消除语言歧义,减少不必要的同义词、词性、句型和概念(叶子南,2017:89)。高度自动化的机器使译文批量生产成为常态,所隐藏的“千人一面”的风险很可能会破坏语言“自然性”,“机器腔”会渗透进源语言(陈津,2018:94),潜移默化中人也渐渐变得像机器人在说话。

(一) 翻译方式碎片化

马克思主义技术伦理思想,机器背景下的工人只是整个机器劳动协作的一小部分,许多人很少去思考整体协作的动力机制。他们用不着知道从哪里进入整个生产结构,也不必去理会自己行为的意义(李三虎,2006:122)。以众包翻译为例,该模式的出现不仅引起对翻译质量、合理报酬、译者地位等翻译伦理问题的讨论(邵璐,2019:127),也有可能导致翻译方式的碎片化。项目由管理层推动,人工译者分到任务后各自完成一部分,很难对翻译项目形成全局把控。参加者身份背景和翻译目的不同,以服从项目统一决策为工作原则,丧失了对译文合理性的判断权。翻译技术开发者优先关注如何加快生产速度,降低成本,却忽略了对译员的人文关怀,使译员感觉不到翻译工作的整体价值和意义,缺少成就感(李彦、肖维青,2018:4)。

海德格尔认为在技术的作用下,人类身处座架(Gestell)的促逼(Herausfordern)之中,自己也已经成为一种持存物,而无法认识真正的自我。“技术乃是在解蔽和无蔽状态的发生领域中,在无蔽即真理的发生领域中成为其本质”(海德格尔,2005:12)。机器翻译也是一种解蔽方式,是促逼着人把自然语言当作持存物来解蔽的“座架”。自然语言成为可被研究、被开采的对象,人们将其纳入“语料库”中,通过各种算法“摆置”它,从而“订造”其在另一门语言里的等价值,人工译者的思维方式也受到机器翻译的侵扰,无法按照自由意志行事,译者本质从而被更深地遮蔽(陈津,2018:93)。这种改变深刻影响着译者的自我认知与自我审视,并重塑人工译者在翻译活动中的存在价值。同时,计算机系统在技术层面和社会层面的变化越来越复杂,表明计算机系统从一种工具变成了代理人(霍文等,2014:223)。人工译者与机器翻译之间的关系,一定程度上类似委托人与代理人的关系,机器翻译在限定角色内完成委托任务,所进行的活动包括不同程度的自动性和人类参与性。但机器翻译无法为自己的工作结果负责,也无法确认译文质量是否达到要求,最终还需人工译员决定是否需调整及如何调整。翻译结果通过人类行为的自主性和机器翻译的自动性结合而实现,以人工译员为主导,并最终为人的利益服务。如过度依赖机器翻译会破坏这种委托关系,造成代理人行使翻译决策权而委托人行为受限的局面,从本质上而言是机器翻译对人工译者主体地位的颠覆和僭越。

2.机器翻译风险控制

数字化时代核心问题之一是如何定位人的主体性地位,这一哲学认识论可作为反思机器翻译价值与风险的基点。海德格尔的技术哲学思想已提供了方向,人类应当让技术回到为人服务、让人回到自己“此在”中去,回到“此在”本身是摆脱技术异化的根本(张天勇,2015:66)。数字化时代的技术与人的关系是处于多元网络中的交叉共轭关系(如图1),机器翻译风险的控制可通过以下三组概念相结合来实现,其中凸显人的主观能动性的因素可体现机器翻译活动中的人文主义价值,而非人为控制的因素则体现其技术主义价值。

(一) 主体能动和客体制约相结合

自我实在论的人学观强调了作为主体的人的自由和独立以及对社会的建构作用(吕俊,2007:72)。人工译者发挥主体能动性,不仅在应用层面发出指令或做出反馈,更重要的是在技术层面对机器进行深度训练。人工译者将从翻译技术的使用者,转为融合语料提供者、算法修正者、质量批评者为一体的综合型主体。“在严格限制场景的条件下,机器翻译可以在特定的领域达到较好的实用化效果”(冯志伟,2018:40)。机器翻译的工作原理建立在二值逻辑选项的基础上,并受到已有数据质量和数量的制约,其优化发展需更多垂直领域语言数据资源持有者加入机器翻译开发,在优化数据或改进算法的基础上,促进语料更新和良性循环,以应对机器翻译面临的客体制约。

(二)知识驱动与数据驱动相结合

机器翻译本身兼具语言学、数学、计算机科学和哲学等超学科属性。人工译者可凭借语言学知识,对机器翻译的问题进行诊断和分析,转换为数学化的表达方式便于计算机理解和修正,从而提高机器翻译质量。或从技术及人文视角对机器翻译的深层机理和运作范式进行研究,并对其研发者和使用者提供人文关怀和伦理指导,以推进机器翻译深度开发和跨学科发展。另一方面需加强神经机器翻译的领域适应训练,通过训练领域敏感网络使得该领域判别器更易做出准确判断,构建系统集成机制(谭敏等,2019:56),利用语言资源丰富的领域帮助资源稀少的领域以提升机器翻译质量。

(三)符号主义与联结主义相结合

符号主义(symbolicism)体现在用符号演算模拟人类大脑,而联结主义(connectionism)通过人工神经网络的并行计算建构脑(徐愚,2016:37-38)。二者对于机器翻译的技术研发和应用都有重要影响,在合作与竞争中形成了各自的代表性特征(如表2)。基于规则的机器翻译体现了符号主义思想,就翻译问题建模,处理输入数据,剔除不符合特定模型的备选值,具有动态调试、可验证性、可解释性等特点,但涉及不同语言之间语义理解和语法规则差异,需采取人工修订方法。随着自然语言处理过渡到深度学习的阶段,机器翻译领域也转向联结主义思想,用电子装置模仿人脑神经网络模型,数据训练过程中采用回归模型来调节中间变量权重系数,无需用户制定规则。基于足够的样本数据,神经网络即可推导出误差度最小的翻译模型,而人工设置规则对术语新词进行语际特征匹配,可提高命名实体精确度。符号主义与联结主义结合互补,可促进机器翻译优化发展。

3.结语

数字化时代技术理念引发的“隐形革命”无处不在,翻译技术领域正逐渐实现从全人工化到人机交互、再到去人工化的模式转变。在机器翻译技术快速迭代的冲击下,人工译者需从主体能动性出发,有意识地发挥修正、评判、反馈功能,接纳技术并改造技术,以免沦为技术的附庸。机器翻译的发展是人文主义关照下人类自然语言和计算机语言相融合的过程,也是人类与技术之间互相塑造与完善的过程。沿着主体能动和客体制约相结合、知识驱动与数据驱动相结合、符号主义与联结主义相结合的路径发展,有助于更好地实现人与技术的互相依存、共轭共生的关系模式。

免费进罗张恩期货实战群,观摩外汇外盘期货/国内商品期货-实时行情分析、每天实盘晒单5次,添加QQ微信:1785751138  备注:期货

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至罗张恩波浪理论的邮箱836168951@qq.com 举报,一经查实,本站将立刻删除。
如若转载,请注明出处:https://www.lzewave.com/3739.html