- 1、本文档共99页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
机器翻译方法
机器翻译原理与方法第二讲 机器翻译方法概述 中国科学院计算技术研究所2009年秋季课程 内容提要 机器翻译方法(按转换层面划分) 直接翻译方法 句法转换方法 语义转换方法 中间语言方法 机器翻译方法(按知识表示形式划分) 基于规则的方法 基于实例的方法(含模板方法、翻译记忆方法) 统计方法 按转换层面划分的机器翻译方法 内容提要 机器翻译方法(按转换层面划分) 直接翻译方法 句法转换方法 语义转换方法 中间语言方法 机器翻译方法(按知识表示形式划分) 基于规则的方法 基于实例的方法(含模板方法、翻译记忆方法) 统计方法 直接翻译方法 通过词语翻译、插入、删除和局部的词序调整来实现翻译,不进行深层次的句法和语义的分析,但可以采用一些统计方法对词语和词类序列进行分析 早期机器翻译系统常用的方法,后来IBM提出的统计机器翻译模型也可以认为是采用了这一范式 著名的机器翻译系统Systran早期也是采用这种方法,后来逐步引入了一些句法和语义分析 内容提要 机器翻译方法(按转换层面划分) 直接翻译方法 句法转换方法 语义转换方法 中间语言方法 机器翻译方法(按知识表示形式划分) 基于规则的方法 基于实例的方法(含模板方法、翻译记忆方法) 统计方法 转换方法 (1) 整个翻译过程分为“分析”、“转换”、“生成”三个阶段; 分析:源语言句子?源语言深层结构 相关分析:分析时考虑目标语言的特点 独立分析:分析过程与目标语言无关 转换:源语言深层结构?目标语言深层结构 生成:目标语言深层结构?目标语言句子 相关生成:生成时考虑源语言的特点 独立生成:生成过程与源语言无关 转换方法 (2) 理想的转换方法应该做到独立分析和独立生成,这样在进行多语言机器翻译的时候可以大大减少分析和生成的工作量; 转换方法根据深层结构所处的层面可分为: 句法层转换:深层结构主要是句法信息 语义层转换:深层结构主要是语义信息 分析深度的权衡 分析的层次越深,歧义排除就越充分 分析的层次越深,错误率也越高 转换方法 (3) 句法层面的转换方法 (1) 句法层面的转换方法 (2) 句法层面的转换方法 (3) 句法层面的转换方法 (4) 句法层面的转换方法 (5) 内容提要 机器翻译方法(按转换层面划分) 直接翻译方法 句法转换方法 语义转换方法 中间语言方法 机器翻译方法(按知识表示形式划分) 基于规则的方法 基于实例的方法(含模板方法、翻译记忆方法) 统计方法 中间语言方法 (1) 利用一种中间语言(interlingua)作为翻译的中介表示形式; 整个翻译的过程分为“分析”和“生成”两个阶段 分析:源语言?中间语言 生成:中间语言?目标语言 分析过程只与源语言有关,与目标语言无关 生成过程只与目标语言有关,与源语言无关 中间语言方法 (2) 中间语言方法的优点在于进行多语种翻译的时候,只需要对每种语言分别开发一个分析模块和一个生成模块,模块总数为2*n,相比之下,如果采用转换方法就需要对每两种语言之间都开发一个转换模块,模块总数为n*(n-1) 中间语言方法 (3) 中间语言方法 (4) 中间语言的类型 自然语言:如英语、汉语 人工语言:如世界语 某种知识表示形式:如语义网络 以某种知识表示形式作为中间语言的机器翻译方法有时也称为基于知识的机器翻译方法 中间语言方法 (5) Makoto Nagao (Kyoto University) said: “.. when the pivot language [i.e. interlingua] is used, the results of the analytic stage must be in a form which can be utilized by all of the different languages into which translation is to take place. This level of subtlety is a practical impossibility.” (Machine Translation, Oxford, 1989) Patel-Schneider (METAL system) said: ”METAL employs a modified transfer approach rather than an interlingua. If a meta-language [an interlingua] were to be used for translation purposes, it would need to incorporate all possible features of many languages. That would not o
文档评论(0)