中介成分体系

    中介成分体系 : 根据外语-汉语机器翻译特点建立的一套特殊的句子成分体系。其中各个成分既不是原语成分,也不是译语成分,而是介于原语和译语之间的句子成分。中介成分是通过原语语法分析和语义分析并考虑到向译语的转换而得出的,它们属于"深层结构"的范围。中介成分不仅能表示成分的功能意义,而且还能表示成分的分布关系(成分与成分之间的联系,成分在句中的位置)和反映两种语言的对比差异。
  中介成分体系不单纯是一套标记句子成分的符号,更重要的是进行多种语言对一种语言的翻译的工具。它还体现了目前中国多数机器翻译规则系统的编制方法和中国机器翻译工作者关于句子切分的理论认识以及他们对翻译技术的处理原则。
  中介成分体系和翻译系统的关系 机器翻译包括3个过程:分析 (Analysis),转换(Transformation)和综合(Synthesis) 。这3个过程可以用3种方法实现:
  ①A →TS
  ②AT →S
  ③A →T →S
  利用第 1种方法编制的规则系统,称为独立分析相关综合的系统。独立分析,就是原语分析只根据原语本身的结构特点进行,不考虑译语的因素,因此分析的最终结果是原语句子成分;相关综合,就是根据原语分析所得的成分进行原语向译语的转换,并在此基础上按译语规范组成译文。
  利用第 2种方法编制的规则系统,称为相关分析独立综合的系统。这里的相关分析,是指在原语结构分析的基础上实现原语句子成分向译语的转换,同时在转换过程中要参照译语规范,因此分析的最终结果是一套中介成分;这里的独立综合,是指只需根据中介成分本身提供的移位信息等组成译文。
  利用第 3种方法编制的规则系统,称为独立分析独立综合的系统。这种系统的特点是原语分析和译语综合都独立进行,而原语向译语的转换则利用一个独立的转换程序,或媒介语来实现。
  3种类型的系统都可进行一对一的翻译,其中独立分析独立综合的系统还可进行逆向翻译。在参与翻译的语言增多的情况下,第 1种系统适用于"一对多",第 2种适用于"多对一",第3种适用于"多对多"。如果把本族语译成多种外语(例如5种),采用第1种系统比较适当。这时只需研制一套为各语言通用的分析程序(独立的)和 5套与之相应的综合程序(相关的)即可。但是,如果目的是把这几种外语译成本族语,采用第2种是完全必要的。这时只需编制 5套分析程序(相关的)和 1套综合程序(独立的)。如果考虑多对多翻译,就要依靠第 3种,其转换部分可通过媒介语来实现。
  根据中国目前的具体情况,要将各国的科技文献翻译成汉语,采用相关分析独立综合系统来进行多对一翻译是非常有利的。而采用这种系统,必然要有一套符号来标记相关分析的结果。这就是这套中介成分体系的由来。
  制定中介成分的原则  一般语法划分出来的句子成分不能满足机器翻译的需要,因为它们只能表示成分的功能意义,而不能表示成分的分布关系并反映两种语言的对比差异。然而,一个成分如果本身不能表示分布关系,机器便不能得到它在句中与哪个词发生联系和处于什么位置的任何信息;如果本身不能反映出两种对比语言的差异,机器便不能在综合加工时直接得到把原语改造成译语的任何根据。因此,中国学者结合机器翻译的特点和要求提出了新的划分成分的原则。
  ①逻辑语义原则:同传统语法中划分句子成分的原则基本一致。根据这一原则,划分出6大类句子成分,即主语类 、谓语类、宾语类 、补语类、定语类、状语类。插入成分和独立成分是状语的两个次类。
  ②结构层次原则:句子是分层次的。该体系以动词(谓语)中心论为基础,认为句中最主要的一层是谓语。谓语是句中最大的联系中心,同时也是调整词序的主轴心。直接与谓语发生关系的成分叫直接成分(简称 A成分),与谓语以外任一其他成分发生关系的成分,叫间接成分。而间接成分又根据它的联系词的远近分作两种:是前一词(组)或后一词(组)的称为近间接成分(简称 B成分),不是前一词(组)或后一词(组)的称为远间接成分(简称C成分)。这样,上述6大类除定语无A成分外,又可分为A、B、C一些子类。
  另外,根据谓语中心论的观点,非限定动词(分词、不定式以及部分动名词)也是句中较大的联系中心(它们可能带一堆宾语和状语),同时也是调整词序过程中比较重要的次轴心。因此,在这个体系中赋予"偏谓语"特征。"偏谓语"本身可以出现在直接成分层,也可以出现在间接成分层,但它所带的成分则只能是间接成分。
  ③对比差异原则:a.根据成分在对比的两种语言中的位置相同与否,可分为"前置成分"、"原位成分"和"后置成分"。b.根据成分在对比的两种语言中是否有介词,可分为"介词性成分"和"非介词性成分"。
  这套成分体系包括几十个中介成分。但这只是一个基础,人们在处理各自的语言时需根据具体情况有所增减,因为任何一对语言都不可能包括所有这些成分,同时也多少存在一些个别现象。这个体系不仅解决了相关分析独立综合的问题(即不管翻译什么语言,原文分析是什么样,而译文综合就使用一套),而且为译文综合创造了极为有利的条件。例如,机器见到"宾 A",便可知道它是同谓语发生联系的直接成分,没有移位信息,故可置之不理。又如见到"前介定 B",便可知道它是一个近间接成分,是介词短语作定语用,有前移信号,而且要移到前一词(成分)之前,因为 B成分的联系词是前一词或后一词。
  中介成分的建立 总括地说,这套成分体系是以结构分析为主要手段以语义分析为辅助手段建立起来的。具体步骤如下:一个句子通过查词典之后,其中绝大部分词已经得到词类标记及其他一些特征,包括根据词尾分析得到的特征。没有得到词类标记的多半是同形词,经过上下文分析,也会得到确定的词类。下一步便是构成词组。根据英汉对比研究,可构成 7类词组,即名词词组、动词词组 、形容词词组 、分词词组、不定式词组、介词词组、副词词组。这些词组,通过上述制定中介成分三原则的加工,便可得出中介成分。而介词在句中起着重要的媒介作用,因此,介词的外理,对于中介成分的确定是一个关键问题。
  当语法分析发生困难,不能解决句法歧义现象和得出正确译文时,要求助于语义分析。例如,We shallhave a symposium on Monday和 We shall have asymposium on mathematics tomorrow这两句话,结构完全相同,如果单靠语法分析,很难得出on- phrase的不同作用。然而,借助语义分析,第 1个on- phrase中的Monday为时间名词,与symposium无语义联系,故可判定为状语,作"前介状A",第2个on-phrase中的mathematics为学科名词,与 symposium有语义联系,故可判定为定语,作"前介定B"。 又如,The fish was bought by the river 和 The fish wasbought by the cook.两句话中都有一个由by引起的介词词组,并都处于谓语之后,都得"前介状 A"成分,但前一个by当"在......旁边"讲,而后一个当"由"讲,其差别仅在于 river是表示地物的名词,而cook是有生命的名词。
  参考书目
 刘涌泉等著:《中国的机器翻译》,知识出版社,上海,1984。

为您推荐

自然语言理解

自然语言理解 : 俗称人机对话。人工智能的分支学科。研究用电子计算机模拟人的语言交际过程,使计算机能理解和运用人类社会的自然语言如汉语、英语等,实现人机之间的自然语言通信,以代替人的部分脑力劳动,包括查..

转注

转注 : 见六书。 ..

周祖谟(1914~  )

周祖谟(1914~  ) :   中国语言学家。字燕孙,北京人。1932年入北京大学中国语言文学系,1936年毕业后考入中央研究院历史语言研究所任语言组助理员。1938年起在辅仁大学国文系任教,中华人民共和国建立后即任北..

《中华大字典》

自然语言处理

自然语言处理 : 人工智能领域的主要内容,即利用电子计算机等工具对人类所特有的语言信息(包括口语信息和文字信息)进行各种加工,并建立各种类型的人-机-人系统。   自然语言与人造(或人工)语言不同,前者是人类社..

转语

转语 : 指语词因声音有变转而别为一意义相通的语词。   语言变转,有因时而变的,有因方言地区不同而变的。晋代郭璞注《尔雅》、《方言》,每每说"语声转",或说"语转"、"声转"。例如《尔雅·释诂》:"卬,我也..

周时经(1876~1914)

周时经(1876~1914) : 朝鲜语言学家。初名相镐。1876年12月23日出生于朝鲜黄海道凤山郡。卒于1914年7月27日。幼习汉文,后入汉城培材学堂学习西方传入的新学。19世纪末20世纪初,朝鲜逐步沦为日本的殖民地。周时..