微軟同聲翻譯軟件多久能否替代人呢 - 遼寧通用翻譯有限公司

華譯網(wǎng)評(píng)論：計(jì)算機(jī)語(yǔ)言翻譯技術(shù)發(fā)展迅速，可以說(shuō)翻譯領(lǐng)域是電腦最容易替代人的領(lǐng)域，翻譯行業(yè)的從業(yè)人員可能是最先因電腦替代而被迫失業(yè)的一批人。翻譯公司也可能是最先因計(jì)算機(jī)語(yǔ)言技術(shù)發(fā)展而倒閉的公司。各國(guó)的翻譯人員和各國(guó)的翻譯公司做好準(zhǔn)備了嗎，趕緊改行吧。哈哈！

　　10月25日，微軟首席研究官、微軟研究院院長(zhǎng)里克雷斯特博士在天津舉辦的“21世紀(jì)計(jì)算大會(huì)”中展示的微軟最新的研究成果――同聲傳譯器，向世人描繪了一幅“跨越語(yǔ)言，溝通無(wú)礙”的美好藍(lán)圖。

　　■速度只比原聲慢半秒

　　在美國(guó)熱播了40年的科幻電視劇《星際迷航》中，有一個(gè)非�！按蜓邸钡墓ぞ擗D―宇宙翻譯器。星際艦隊(duì)成員把它別在胸前徽章里，整個(gè)星際聯(lián)邦都廣泛使用它將所有的已知語(yǔ)言翻譯為聽(tīng)者所懂的語(yǔ)言，對(duì)其余的未知語(yǔ)言也可通過(guò)對(duì)簡(jiǎn)短幾句話的分析而進(jìn)行轉(zhuǎn)換。按照劇中設(shè)定，宇宙翻譯器要到22世紀(jì)才能發(fā)明。

　　不過(guò)，在雷斯特的設(shè)想中，這種翻譯器的出現(xiàn)可能不用等那么久，他日前展示的“同聲傳譯”就是通往宇宙翻譯器的重要一環(huán)。

　　在這個(gè)10分鐘左右的演示中，雷斯特一直中速講英文，他背后有兩個(gè)大屏幕�，F(xiàn)場(chǎng)觀眾都看到其中一個(gè)屏幕把他講的話以英文文本的形式展示出來(lái)，速度大概只比他的聲音慢小半秒。

　　在另一個(gè)屏幕上，上半部把英文文本中的單詞提取出來(lái)，并對(duì)應(yīng)中文單詞，而下半部按照中文語(yǔ)序已經(jīng)排列成中文句子。

　　隨后，最令人激動(dòng)的時(shí)刻到來(lái)了，翻譯完的中文句子以普通話的形式“說(shuō)”了出來(lái)，聲音聽(tīng)起來(lái)與雷斯特本人很像，速度基本上是他一說(shuō)完英語(yǔ)，機(jī)器就“說(shuō)”出仿真聲音的中文翻譯，聽(tīng)起來(lái)就像雷斯特在給自己做同聲傳譯。

　　他表示，微軟的同聲傳譯不僅能英譯漢，還能翻譯西班牙語(yǔ)等26種語(yǔ)言。雖然目前還沒(méi)有走出實(shí)驗(yàn)室，未來(lái)卻可能做成同聲傳譯器，以至有人驚呼學(xué)同聲傳譯的人豈不是要失業(yè)么？

　　■語(yǔ)言識(shí)別并未完美

　　這個(gè)吸引眼球的演示第一步就是用計(jì)算機(jī)識(shí)別雷斯特的英文發(fā)言，但是這可能也是最難的一步。

　　雷斯特介紹，最開(kāi)始的語(yǔ)言識(shí)別采用簡(jiǎn)單的模式匹配，計(jì)算機(jī)檢查語(yǔ)音產(chǎn)生的波形，并盡量與已知相關(guān)的特定單詞相匹配。不過(guò)這一方法失效率太高了。

　　直到七八十年代，隱式馬爾科夫模型（HMM）被廣泛應(yīng)用，它利用來(lái)自多個(gè)人的培訓(xùn)數(shù)據(jù)建立更為穩(wěn)健的統(tǒng)計(jì)語(yǔ)音模型，成為語(yǔ)言識(shí)別的主流。不過(guò)，直到今日，即使是最佳的語(yǔ)音系統(tǒng)，在任意語(yǔ)音上的單詞出錯(cuò)率還高達(dá)20%-25%。

　　“兩年前，我們和多倫多大學(xué)的研究人員使用一項(xiàng)名為深度神經(jīng)網(wǎng)絡(luò)的技術(shù)，仿照人腦行為，語(yǔ)音的錯(cuò)誤率比之前的方法降低30%。這意味著之前四五個(gè)單詞中就會(huì)出現(xiàn)一個(gè)錯(cuò)誤，而現(xiàn)在七八個(gè)單詞中才會(huì)出現(xiàn)一個(gè)錯(cuò)誤。”

　　雖然微軟同聲傳譯的技術(shù)細(xì)節(jié)仍未透露，不過(guò)聲學(xué)專家解釋，這一技術(shù)還是建立在HMM的框架上，改為用神經(jīng)網(wǎng)絡(luò)模擬語(yǔ)音特征分布，從八九十年代就有應(yīng)用。只是現(xiàn)在計(jì)算能力提高，能把模型做得更細(xì)，也就更“深度”。

　　這種方法的準(zhǔn)確率與數(shù)據(jù)積累有很大關(guān)系。計(jì)算機(jī)越來(lái)越多地學(xué)習(xí)、掌握更多數(shù)據(jù)，就會(huì)更聰明，這就是“機(jī)器學(xué)習(xí)”，不過(guò)機(jī)器學(xué)習(xí)依然有限度。如果是針對(duì)專人的優(yōu)化“學(xué)習(xí)”，語(yǔ)言識(shí)別的性能會(huì)提高得多一些。

　　■機(jī)器翻譯能代替人工翻譯？

　　說(shuō)話人的語(yǔ)言被識(shí)別了，如何英譯漢也是個(gè)大問(wèn)題。數(shù)據(jù)顯示，近幾十年來(lái)，因機(jī)器翻譯質(zhì)量存在問(wèn)題，一直無(wú)法成為翻譯的主流。我們經(jīng)常會(huì)使用軟件翻譯頁(yè)面，所得文本之凌亂不言而喻。

　　雷斯特表示，他的演示中英譯漢需要兩個(gè)步驟：“第一步是提取我說(shuō)的單詞，然后找到相應(yīng)的中文，雖然這并不簡(jiǎn)單，但確實(shí)是比較簡(jiǎn)單的一步。第二步是重新調(diào)整單詞的順序，使之符合中文習(xí)慣，這是語(yǔ)音正確翻譯的重要一步�！�

　　雷斯特所說(shuō)的步驟與目前機(jī)器翻譯的方法是一致的。難點(diǎn)就在于譯文選擇和調(diào)序，不同語(yǔ)言語(yǔ)序不同，一個(gè)詞翻譯成另一種語(yǔ)言也可能有多個(gè)候選譯文，所以機(jī)器翻譯結(jié)果有時(shí)漏洞百出�，F(xiàn)有提高正確率的方法需要依靠統(tǒng)計(jì)學(xué)。

　　雷斯特也承認(rèn)，微軟的同聲傳譯在文本方面還有很多錯(cuò)誤，而且翻譯結(jié)果可能很搞笑。不過(guò)，統(tǒng)計(jì)技術(shù)和大數(shù)據(jù)的引入將使文本翻譯有翻天覆地的變化。

　　然而，有專家認(rèn)為，機(jī)器翻譯只能在某個(gè)特定領(lǐng)域達(dá)到較高的準(zhǔn)確率，比如法律或經(jīng)濟(jì)領(lǐng)域能達(dá)到80%到90%的準(zhǔn)確率，這是因?yàn)樵谔囟I(lǐng)域詞義有了明確界定。而在通用領(lǐng)域，機(jī)譯準(zhǔn)確率不會(huì)很高，還是要依賴人工翻譯的經(jīng)驗(yàn)。

　　■模仿的聲音有多像？

　　“數(shù)年后我希望打破人與人之間的語(yǔ)言障礙�！碑�(dāng)雷斯特用英語(yǔ)說(shuō)出這句話一秒鐘后，微軟同聲翻譯機(jī)模仿他的聲音用中文說(shuō)出。臺(tái)下的觀眾報(bào)以熱烈的掌聲。

　　確實(shí)，如果能在翻譯中保留說(shuō)話人的語(yǔ)調(diào)，交流將會(huì)更順暢。雷斯特說(shuō)：“我這個(gè)不會(huì)說(shuō)中文的人以自己的聲音‘說(shuō)’出中文實(shí)在令人興奮�！倍_(dá)到這一效果，需要一個(gè)文本到語(yǔ)音的系統(tǒng)，包含數(shù)小時(shí)中國(guó)人說(shuō)話的語(yǔ)音。此外，他還要預(yù)先錄制1小時(shí)的英文語(yǔ)音數(shù)據(jù)用來(lái)提取自己的聲音屬性，最后得到仿佛自己在說(shuō)中文的效果。

　　這是一個(gè)個(gè)性化語(yǔ)音合成技術(shù)。一般情況下，機(jī)器通常只需模仿固定的男女兩種聲音，而要得到針對(duì)專人的仿聲，則需要獲得他/她的語(yǔ)音數(shù)據(jù)，提取發(fā)聲相關(guān)的特征參數(shù)，比如節(jié)奏、頻率、語(yǔ)氣，也就是專業(yè)術(shù)語(yǔ)說(shuō)的基頻等等。當(dāng)合成系統(tǒng)適應(yīng)后，就可以輸出仿真聲音了。

　　不過(guò)，模仿聲音無(wú)法做到以假亂真，應(yīng)該只能做到七分像，因?yàn)槟７轮荒馨岩粋€(gè)人的習(xí)慣在單調(diào)水平上重現(xiàn)。比如，可以通過(guò)一個(gè)人走路的習(xí)慣、步長(zhǎng)、左右搖晃等準(zhǔn)確模仿他的行走。但是人講話的信息量太大，雖然理論上可以分析節(jié)奏、頻率，但是要完全量化技術(shù)上還是做不到。(北京青年報(bào) 秦文)