百度翻译中实用文本汉译英错误类型及纠错方法初探
我要投稿 论文查重 来源:学报编辑部 时间:2019-02-19 浏览:
【字体:
摘  要:日新月异的机器翻译技术催生了新的写作方式,即先以中文成文并利用机器翻译译为英语,再对译文进行修改形成终稿。为了探究百度译文质量,笔者以《中国科技翻译》 34篇论文的中文摘要作为相关语料,并根据语料整理出了词语层面、句子层面的9项百度翻译常见错误类型,并分
关 键 词: 百度翻译 实用文本英译 错误类型 初步纠错方法
作  者:梁云思
单  位:云南师范大学
正  文: 1研究背景 百度于2015年5月发布了神经网络翻译系统(Baidu Neural Machine Translation),使译文质量大幅提升,成为世界上首个互联网NMT线上产品。相较于传统的统计机器翻译(Statistical Machine Translation,SMT),NMT所产生的译文更接近自然语言,提高了用词及语序的正确性。同时,百度翻译提供即时免费的多语种文本翻译和网页翻译服务,支持中、英、日、韩、泰、法、西、德等28种热门语言互译。 很多英语写作者有先创作中文文本,并利用机器翻译译为英语,再对译文进行修改形成英文终稿的写作习惯。这体现了国际交流的需要与语言技术发展的趋势,百度翻译也是国内大多数中级、中初级英语学习者的主要选项。机译必然会减少人工参与,但机译与人工翻译的磨合之路还很漫长,同时机译不适用于“走心”的非实用文本翻译现状将长期存在,但技术的不断进步,必然会给译者带来更多的便利。 2问题聚焦 目前的百度翻译汉译英文本仍然存在许多错误,其中包含一些对于中初级英语学习者较难发现与识别的错误,这会倒是使用者无法提取正确译文,甚至对错误翻译形成固定认识。 为了探究百度翻译的实际翻译质量,笔者以《中国科技翻译》30篇论文的中文摘要作为语料,利用百度翻译得到对应英语译文,再对译文进行人工分析。 3翻译纠错探讨 在对百度汉译英文本进行分析后,笔者发现其中存在很多类型化和高度重复性的错误。 同时需要指出的是与包凯对谷歌神经网络机器翻译系统的汉译英语料分析结果相同,在百度的神经网络翻译系统中也同样没有任何一种特定的语言结构能映射出必然错误,即任何导致高度重复错误的话语结构都存在例外。例如:百度翻译将“为此,可以借鉴地道的英语表达,点化名家的经典译例”译为:To this end, can learn authentic English expression, classic examples of famous Attunement。此译文“can learn”前缺少主语,是错误的。再看“为此,可以借鉴地道的英语表达,查阅名家经典译例”一句,又被译为:To this end, we can learn from the authentic English expression and refer to the classic examples of translation。只在同一位置替换了一个动词,刚才的错误就消失了。再看“为此,可以借鉴地道的英语表达,重译名家经典译例”又被译为:To this end, can learn authentic English expression, retranslation of the famous classic examples。仅在同一位置替换了一个动词,同一类型的错误结构再次被触发。 语料分析结果显示百度翻译存在“盲区”,其中类型化高重复性的错误都产生于词语层面及句子层面。词语层面又分为:词性误用,单复数误译,专业术语错误;句子层面又分为:句子不完整,句子结构解析失误产生错译,未将表达由主动转为被动,逐字翻译形成累赘译文,隐含逻辑关系漏译,明喻翻译不当。以下逐个对上述10项错误类型进行举例说明。 3.1词性误用 原句:“(3)表达累赘;(4)信息含混;(5)语用失误”译为:(3) expression of redundancy; (4) information ambiguity; (5) pragmatic failure。误译在于将“主题+谓语”结构按照原文顺序翻译为了“名词+名词”结构。译者在修改译文时应将“redundancy”换成“redundant”前置并去掉“of”,将“ambiguity”换成“ambiguous”前置。 3.2单复数误译 原句:“旨在为武术界学者和相关翻译工作者提供参考”译为:in order to provide reference for the martial arts scholar and translator。误译在于将“学者”译为“scholar”,“翻译工作者”翻译为“translator”,“参考”译为单数“reference”。译者在修改译文时应提高对于目的语单复数形式的敏感度,将以上译文修改为复数形式。 3.3专业术语错误 原句:“本文提出了中国地名意译的四条原则”译为:This paper puts forward four principles of the translation of the names China。就划线部分的翻译专业术语来看将“意译”简单翻译为了“translation”,译者应将其修改为“free translation”。 原句:“本文通过从具有法律专业含义的普通词汇、外来词的存在、古旧词汇的使用,以及表达的正式性等方面来探讨并归纳法律英语的词汇特征”,译为:This paper discusses and summarizes the lexical features of legal English from the aspects of common words, the existence of loanwords, the use of old words, and the formality of expression。就划线部分的语言学专业术语来看将“外来词”误译为了“loanwords”,将“表达的正式性”简单译为了“the formality of expression”,译者应该着重核对译文专业术语,在修改时将“表达的正式性”译为目的语的语言学专业术语“register”,对于在目的语中无明确对应词的专业术语“外来词”采用意译法译为:“words borrowed from other languages” 。 3.4句子不完整 原文:“文物翻译是跨文化传播中的重要一环”译为:The translation of cultural relics is an important part of intercultural communication。从上下文来看原文的“文物翻译”所指为文物展品名词及文物介绍文本的翻译,而译文简单翻译为“the translation of cultural relics”,译者检查时应将其补充完整修改为:“the translation of texts about cultural relics”。 3.5多重修饰语错译 原文:“分析了费米尔的目的法则是如何指导译者生产出高质量的、更符合受众需求的译文”,译为:analyzes the Vermeer's Skopos rule is how to guide the translator to produce high quality, more in line with the needs of the audience。原文结构为“动词+宾语{主语+谓语+宾语[主语+谓语+宾语(双重修饰语+名词)]}”,译文将原文“双重修饰语+名词”结构“高质量的、更符合受众需求的译文”译为:high quality, more in line with the needs of the audience,显然没有正确解析句子,更没有完成翻译。译者应该仔细理解原文的意思,剥离原文外壳,用目的语的表达习惯将其表达出来,将其译为:“high quality translations that meet the needs of the audience”。 3.6未将表达由主动转为被动 原文:“集装箱及其催生的集装箱运输正深刻地影响着世界物流配送方式”,译为:The container and its expedited container transport are profoundly affecting the way of the world logistics and distribution。译文的细节错误先不谈,它将汉语的主动句翻译为英语的主动句。不同于汉语多用动态呈现事物,英语习惯于以静态形式呈现事物,即英语的被动句要多于汉语,这是翻译时不能忽略的。译者在修改时应将句子由原句的主动句转换为目的语的被动句,将其译为:“The mode of distribution in logistics has been deeply influenced by container and its transportation all over the word”。 3.7逐字翻译形成累赘译文 原文:“以期唤起相关部门对武汉市近代历史建筑遗产的关注”,译为:in order to raise the relevant departments of the heritage of modern historic buildings in Wuhan City。抛开译文细节错误,其为逐字翻译,不仅没有形成意思完整的译文,同时还使得译文冗长不堪。译者在修改译文时可采用减译法译为:“to arouse attention to Wuhan’s historical architectural heritage”。 3.8隐含逻辑关系漏译 原文:“在物流配送中,产生了大量与集装箱密切相关的用语”,译为:In the logistics distribution, there are a large number of expressions which are closely related to the container。该句原文与上文存在因果关系,而译文仅以句子为单位进行翻译,没有翻译出原文所具有的逻辑关系。译者在修改译文时应该从文本角度把握原文,可译为:“It results in a great number of expressions related to container in the distribution of cargoes”。 3.9修辞翻译不当 原文:“科普杂志是科普战线的轻骑兵”译为:Science magazine is the Hussar science front。原文将普及科学的交流活动比作战线,将科普杂志比作轻骑兵,而译文仅将“战线”、对应的“front”,“轻骑兵”对应的“hussar”简单罗列出来,使人不知所云。由于该原文为翻译类论文摘要,译者在翻译时可以先看目的语是否有对应或相类似的隐喻或暗喻,如果没有则可直接放弃使用修辞而改用意译法,可译为:“Popular science magazines are effective tools of science communication”。 4结语 翻译与写作密不可分,新的翻译技术使写作方式发生巨变,同时新的课题也由之产生,对于译者是如何更加科学合理地运用新翻译技术带来的便利,对于新翻译技术研发团队是如何提高机译的准确率及效率。 本文以《中国科技翻译》的论文中文摘要作为相关语料来探析百度译文质量,从词语层面、句子层面归纳了9种常见错误类型,并提出了相应的初步纠错方法,以期为翻译爱好者提供参考。当然,随着百度研发团队扩充语料库等修正工作的深入,这些类型的语言错误可能会在之后机译译文中逐渐减少。 5参考文献 1包凯.谷歌翻译汉译英错误类型及纠错方法初探[J].中国科技翻译,2017(4) 2李长栓.非文学翻译理论与实践[M].中国对外翻译出版公司,2004 3叶子南.又想起了斯坦纳——写在新版“谷歌翻译”诞生之际[J].中国翻译,2017(1) 4何刚强.笔译理论与技巧[M].外语教育与研究出版社2009 5魏向清.术语翻译研究导引[M].南京大学出版社2012 Error Patterns in Baidu Translate C-E translation ofPragmatic Texts and PreliminaryMethods of Error Correction Liang Yunsi Abstract The development of machine translation technology proved a new writing approach: extracting English texts from the Chinese by machine, and then modifying the texts to from the final draft. In order to explore the translation quality of Baidu Translate,the author had taken 34 papers ‘Chinese abstracts of “Chinese science and technology translation”ascorpus, and summed up 9 categories of Baidu Translate’ s common error patterns in words level and sentence level, and simultaneously analyzed preliminary methods of error correction. Key Words Baidu Translate English translation of practical texts error patterns preliminary methods of error correction

【欢迎投稿:[email protected]】 【论文检测】 【返回首页】 【打印本页】 【关闭窗口