【大紀元2012年11月13日訊】 (大紀元記者林南綜合報導)微軟(Microsoft)經過兩年時間研發的語音識別技術取得重大突破,除了可準確地把講者所說的英語翻譯成中文,並能模仿講者的聲音語調說出來。一個英語即時譯成中文的同步口譯軟體有望在不久的將來面世。
11 月 8 日,微軟公司研發部門在Youtube上公開了微軟首席研究官(CRO)拉希德(Rick Rashid)今年10月在中國舉行的一場演講錄像。在錄像中,拉希德展示最新研究成果的英文演講自動轉換成中文,且用同樣的腔調說出。
具體的情形是:拉希德一邊演講,軟體就會辨識他所講的英文,即時將語音轉換成英文字,再翻譯及重組成通順的中文,然後模仿拉希德的聲音語調,以普通話將翻譯內容讀出來,達到同步口譯的效果。
拉希德表示:「這是深部神經網絡(Deep Neural Networks)技術的運用,該技術排列人腦的運作,使研究者能用比過去更好的方式辨識語音。」
微軟解釋,人造神經網絡(Artificial neural networks)是在人類大腦中的低水平電路的數學模型,被應用於語音識別已超過20年,但只是在幾年前,在計算機和統計技術發展到了一定的程度,科學家們才獲得足夠的計算能力,能夠建立細粒度的和複雜的模型, 使得自動語音技術得到認可。
拉希德透露,軟體能模仿他的聲音,是因為研究員事前先將本地中國人的說話內容,以及他本人講英文的錄音輸入電腦進行分析。
拉希德之前曾表示,軟體仍在改善階段,但語音翻譯出錯率已較以往同類技術大幅減少了三分之一。
雖然有些細節仍不夠完美,但拉希德認為,這是一個未來的希望,即使仍有許多工作要做,但他相信這能打破人與人之間語言的隔閡。「數年後,我們希望能夠打破人與人之間的語言障礙。」