翻譯公司論語(yǔ)音翻譯

日期：2012-07-12 | 閱讀：

根據(jù)目前國(guó)際上研究開(kāi)發(fā)的一些口語(yǔ)翻譯實(shí)驗(yàn)系統(tǒng)所采用的不同的翻譯機(jī)制，翻譯公司將其劃分為三種主要類型[Zong et al., 2002]：傳統(tǒng)翻譯方法、非傳統(tǒng)翻譯方法和人機(jī)互助的混合翻譯方

根據(jù)目前國(guó)際上研究開(kāi)發(fā)的一些口語(yǔ)翻譯實(shí)驗(yàn)系統(tǒng)所采用的不同的翻譯機(jī)制，翻譯公司將其劃分為三種主要類型[Zong et al., 2002]：傳統(tǒng)翻譯方法、非傳統(tǒng)翻譯方法和人機(jī)互助的混合翻譯方法。

3.1 傳統(tǒng)翻譯方法

所謂的傳統(tǒng)翻譯方法主要指如下四種基本的翻譯方法：（1）基于規(guī)則（rule-based）的語(yǔ)音翻譯方法；（2）基于事例（example-based）和模板（template-based）的語(yǔ)音翻譯方法；（3）基于中間語(yǔ)義表示的（inter-lingual）語(yǔ)音翻譯方法；（4）基于統(tǒng)計(jì)模型的（statistical）翻譯方法。由于這四種翻譯方法是在文本機(jī)器翻譯中提出來(lái)的，并切有的已被廣泛地應(yīng)用于商業(yè)化翻譯軟件和實(shí)驗(yàn)系統(tǒng)中，因此，我們將其稱之為主流的翻譯方法。關(guān)于這些方法的優(yōu)缺點(diǎn)已經(jīng)有很多論著中給予了評(píng)述，這里我們不再贅述。

3.2 非傳統(tǒng)翻譯方法

所謂的非傳統(tǒng)翻譯方法是指除上述四種基本的方法以外，近幾年來(lái)提出和被嘗試的其它各種新的翻譯策略。盡管這些翻譯方法不像傳統(tǒng)的翻譯方法那樣被廣泛地承認(rèn)和采用，但它們畢竟是眾多的研究者向著實(shí)用、高效的翻譯目標(biāo)逼近的見(jiàn)證，而且其中的許多思想和策略同樣值得我們借鑒。我們將這些翻譯方法稱之為非主流的翻譯方法。

1997年Wakita等人曾提出了一種局部抽取可正確翻譯成分的語(yǔ)音翻譯方法[Wakita et al., 1997]，其基本思想是以基于事例的翻譯方法為基礎(chǔ)，翻譯模塊首先對(duì)輸入語(yǔ)句進(jìn)行句法和語(yǔ)義解析，然后在解析結(jié)果中尋找那些具有一定的長(zhǎng)度（詞匯達(dá)到一定的個(gè)數(shù)）、結(jié)構(gòu)上符合句法、與事例庫(kù)中某一例句（或片斷）的語(yǔ)義距離小于給定門限的那些片斷或語(yǔ)塊，最后通過(guò)基于事例的翻譯方法只翻譯那些符合條件的片斷或語(yǔ)塊。實(shí)際上這種方法采用的是一種“回避困難”的權(quán)宜之計(jì)。我們注意到，這種翻譯方法并不是從整個(gè)輸入語(yǔ)句的全局來(lái)進(jìn)行語(yǔ)塊或片斷的切分[Furuse et al, 1998]，而只是局部地計(jì)算片斷與事例庫(kù)中短語(yǔ)（或片斷）的語(yǔ)義距離，這樣有可能抽取出的翻譯片斷與原輸入語(yǔ)句的含義并不相符，而且，有時(shí)候整個(gè)輸入語(yǔ)句中抽取不出任何可翻譯的片斷，整個(gè)翻譯系統(tǒng)也就無(wú)任何輸出。另外，這種翻譯方法與語(yǔ)義計(jì)算密切相關(guān)，因此，需要有一部高質(zhì)量的語(yǔ)義詞典和能夠真正反映片斷之間相似性的語(yǔ)義距離測(cè)度模型，而這些對(duì)于中文計(jì)算來(lái)說(shuō)，往往都是比較困難的。

1999年日本德島大學(xué)（The University of Tokushima）教授任福繼博士提出了一種基于超函數(shù)的翻譯方法（Super-Function Based Machine Translation, SFBMT），這種翻譯方法的基本出發(fā)點(diǎn)是：在目前機(jī)器翻譯系統(tǒng)不能做到“信、達(dá)、雅”翻譯目標(biāo)的情況下，用戶與其對(duì)系統(tǒng)翻譯正確率和譯文可讀性等提出不現(xiàn)實(shí)的過(guò)高要求，還不如提高系統(tǒng)的運(yùn)行速度、減少系統(tǒng)開(kāi)銷、提高系統(tǒng)可控性和易修改性等性能來(lái)得現(xiàn)實(shí)。例如，一個(gè)以英語(yǔ)為母語(yǔ)的機(jī)器翻譯系統(tǒng)用戶并不會(huì)在意系統(tǒng)把“吃藥”翻譯成“take medicine”還是“eat medicine”。因此，基于這種考慮，任福繼教授提出了利用超函數(shù)（Supper-Function, SF）建立原語(yǔ)言輸入與目標(biāo)語(yǔ)言輸出之間映射關(guān)系的實(shí)現(xiàn)思路。具體地講，這種方法不像其它基于分析的機(jī)器翻譯系統(tǒng)一樣對(duì)原語(yǔ)言句子進(jìn)行徹底的句法和語(yǔ)義分析，而是通過(guò)構(gòu)造SF來(lái)建立原語(yǔ)言句子模板和目標(biāo)語(yǔ)言句子模板的對(duì)應(yīng)關(guān)系 [Ren, 1999a]。問(wèn)題的關(guān)鍵是如何獲取SF。[Ren, 1999b] 和 [Ren et al., 2000]介紹了一種機(jī)器輔助的從雙語(yǔ)對(duì)照語(yǔ)料中獲取SF的基本方法。實(shí)際上，這種基于SF的直接翻譯方法，在本質(zhì)上與統(tǒng)計(jì)模型和模板方法是完全一直的。

日本ATR-SLT （Spoken Language Translation Laboratories）研究所的Yamamoto等人提出了一種基于輸入語(yǔ)句改寫的口語(yǔ)翻譯模型，稱之為Sandglass翻譯模型[Yamamoto et al, 2001, 2002；Zong, 2001; 宗，2002b]。這種翻譯方法的一種解釋是當(dāng)翻譯引擎不能實(shí)現(xiàn)輸入句子的正確翻譯時(shí)，讓系統(tǒng)的原語(yǔ)言預(yù)處理模塊自己實(shí)現(xiàn)輸入句子的自動(dòng)改寫，并不斷為翻譯引擎提供原來(lái)語(yǔ)句另外可能的表達(dá)形式。其基本思想是借鑒和模擬人在進(jìn)行口語(yǔ)翻譯時(shí)的基本模式。另一種解釋是，由于翻譯模塊能夠處理的語(yǔ)言現(xiàn)象往往是有限的，如果系統(tǒng)原語(yǔ)言預(yù)處理模塊能夠生成輸入語(yǔ)句的其它多種表達(dá)形式，那么這些表達(dá)形式中只要有一個(gè)落入到系統(tǒng)可以處理的有限的句型集之內(nèi)，系統(tǒng)就可以得到原輸入語(yǔ)句的正確翻譯結(jié)果。Sandglass翻譯模型的直接效果是把復(fù)雜的原語(yǔ)言解析任務(wù)從翻譯模塊中分離出來(lái)，讓原語(yǔ)言本身來(lái)表達(dá)輸入語(yǔ)句的含義，翻譯模塊可以采用簡(jiǎn)單的轉(zhuǎn)換方法，例如：模板直接匹配等方法，實(shí)現(xiàn)有限集內(nèi)原語(yǔ)言到目標(biāo)語(yǔ)言的翻譯轉(zhuǎn)換。

實(shí)際上，Sandglass口語(yǔ)翻譯模型面臨許多新的問(wèn)題和技術(shù)難點(diǎn)，而且，人們最容易提出這樣一個(gè)問(wèn)題：如果系統(tǒng)能夠?qū)υ斎胝Z(yǔ)句進(jìn)行分析和改寫，那么，為什么不直接將其翻譯呢？

后來(lái)，人們提出了基于簡(jiǎn)化表達(dá)式的語(yǔ)音翻譯方法[Zong et al., 2000b]等多種方法?？偲饋?lái)說(shuō)，非傳統(tǒng)方法基本上都是在傳統(tǒng)方法的基礎(chǔ)上進(jìn)行的改造。

3.3 人機(jī)互助的混合翻譯方法

人機(jī)互助的混合翻譯方法是指多種翻譯策略并用的多引擎交互式口語(yǔ)翻譯方法。目前從事的語(yǔ)音翻譯研究都是針對(duì)推進(jìn)式的對(duì)話方式（push-to-talk dialogue），即兩個(gè)持不同語(yǔ)言的說(shuō)話人之間的對(duì)話過(guò)程是按每人一句進(jìn)行的，也就是說(shuō)當(dāng)一方說(shuō)完以后，系統(tǒng)把該說(shuō)話人的語(yǔ)句翻譯完畢并發(fā)送給對(duì)方，對(duì)方聽(tīng)完來(lái)自彼端說(shuō)話人的翻譯語(yǔ)音后才開(kāi)始發(fā)音。在這種情況下，翻譯人員（翻譯器）可以有機(jī)會(huì)與說(shuō)話人溝通，在實(shí)施翻譯之前翻譯（器）可以主動(dòng)地與說(shuō)話人對(duì)話，弄清說(shuō)話人使用的詞匯，確認(rèn)說(shuō)話者的意圖。我們認(rèn)為，在這種對(duì)話翻譯系統(tǒng)中，中間翻譯角色必須具備與說(shuō)話人對(duì)話的能力，即翻譯者與說(shuō)話人之間應(yīng)該是交互式的，而不是單向的。但從目前研究情況來(lái)看，除了JANUS系統(tǒng)外，幾乎都不是人機(jī)交互式的，人們只是在原語(yǔ)言識(shí)別和分析技術(shù)上下功夫，一廂情愿地希望能夠通過(guò)改進(jìn)識(shí)別技術(shù)和翻譯策略來(lái)提高系統(tǒng)翻譯的正確率和魯棒性，但實(shí)際上這有點(diǎn)兒徒勞無(wú)功，因?yàn)楫吘谷苏f(shuō)話是無(wú)法控制的，說(shuō)話人愿意怎么講就怎么講，想到哪里就說(shuō)到哪里，根本不像書(shū)面語(yǔ)那樣經(jīng)過(guò)深思熟慮，并且有表達(dá)符號(hào)標(biāo)記，而且說(shuō)話人可能隨時(shí)對(duì)前面說(shuō)過(guò)的話進(jìn)行修正，在這種情況下讓系統(tǒng)無(wú)論“聽(tīng)懂”還是“聽(tīng)不懂”硬去翻譯，根本不給系統(tǒng)提問(wèn)的機(jī)會(huì)，這有點(diǎn)兒不合情理，好像翻譯器和說(shuō)話人也都是不負(fù)責(zé)任的，說(shuō)話人不管系統(tǒng)是否理解，只管說(shuō)，系統(tǒng)則不管理解的對(duì)與錯(cuò)，只管翻。以這種方式實(shí)現(xiàn)的語(yǔ)音翻譯系統(tǒng)的正確率和魯棒性至今沒(méi)有根本性的改進(jìn)和提高也似乎是情理之中的事情。

近幾年中人們提出了一些交互式翻譯的設(shè)想[Waibel, 1996; Boitet, 1996; Blanchon, 1996; Seligman, 1997, 1998]，但通過(guò)對(duì)這些交互式口語(yǔ)翻譯系統(tǒng)的分析我們發(fā)現(xiàn)，其交互過(guò)程都是針如何校對(duì)語(yǔ)音識(shí)別器的錯(cuò)誤結(jié)果進(jìn)行的，這種實(shí)現(xiàn)思想的出發(fā)點(diǎn)都是認(rèn)為機(jī)器翻譯模塊只能接受100％正確的輸入語(yǔ)句。而實(shí)際上這是不現(xiàn)實(shí)的，一方面，語(yǔ)音識(shí)別器不可能做到無(wú)錯(cuò)誤識(shí)別，尤其說(shuō)話人在復(fù)雜環(huán)境下；另一方面，說(shuō)話人與系統(tǒng)之間的交互過(guò)程勢(shì)必要影響系統(tǒng)的實(shí)時(shí)性，更重要的是說(shuō)話人是否愿意使用這樣一個(gè)繁瑣的需要不停地校對(duì)錯(cuò)誤的用戶界面，用戶所能夠忍受的極限有多大？進(jìn)一步分析，即使機(jī)器翻譯模塊接收到的輸入是完全正確的，系統(tǒng)就一定能夠得到正確的輸出嗎？顯然未必。那么，問(wèn)題就在于系統(tǒng)是否能夠真正“理解”說(shuō)話人的意圖，如果系統(tǒng)一旦發(fā)現(xiàn)輸入語(yǔ)句中存在無(wú)法消除的歧義，系統(tǒng)如何與說(shuō)話人進(jìn)行交互，向說(shuō)話人獲取系統(tǒng)想要得到的知識(shí)。因此，基于這樣的考慮我們提出了基于對(duì)話管理的交互式語(yǔ)音翻譯方法[Zong et al., 2002]，在這個(gè)交互式翻譯框架下，我們提出了基于填充槽的翻譯方法（Slot-based translation）。

譯雅馨深圳翻譯認(rèn)為，基于對(duì)話管理的交互式口語(yǔ)翻譯方法基本上模擬了人的翻譯過(guò)程，該方法不但可以方便地集成傳統(tǒng)翻譯方法和非傳統(tǒng)翻譯方法中的多種翻譯策略，而且可以將語(yǔ)音－語(yǔ)音翻譯和文本－語(yǔ)音翻譯有效地統(tǒng)一起來(lái)，有利于推進(jìn)口語(yǔ)翻譯系統(tǒng)的盡早實(shí)用化。

3.4 分析方法與統(tǒng)計(jì)方法的比較

分析方法與統(tǒng)計(jì)方法一直是自然語(yǔ)言處理中采用的兩大主流方法，實(shí)際上，在我們上面介紹的三種翻譯方法中，分析方法與統(tǒng)計(jì)方法都是不可缺少的兩種基本方法。在過(guò)去自然語(yǔ)言處理研究中，尤其是機(jī)器翻譯研究的幾十年中，關(guān)于這兩種方法的優(yōu)劣比較和結(jié)合策略等問(wèn)題的爭(zhēng)論從來(lái)都沒(méi)有停止過(guò)。2002年日本ATR-SLT的Sumita博士介紹，在ATR進(jìn)行的語(yǔ)音翻譯實(shí)驗(yàn)中，基于事例的翻譯方法的正確率要遠(yuǎn)遠(yuǎn)高于基于統(tǒng)計(jì)的翻譯方法[Sumita, 2002]

上一篇：解析母語(yǔ)負(fù)遷移對(duì)漢英翻譯的重要影響下一篇：翻譯任務(wù)與標(biāo)準(zhǔn)