語音識別技術重大突破 微軟展示英譯中同步口譯

人氣 6
標籤:

【大紀元2012年11月13日訊】 (大紀元記者林南綜合報導)微軟(Microsoft)經過兩年時間研發的語音識別技術取得重大突破,除了可準確地把講者所說的英語翻譯成中文,並能模仿講者的聲音語調說出來。一個英語即時譯成中文的同步口譯軟體有望在不久的將來面世。

11 月 8 日,微軟公司研發部門在Youtube上公開了微軟首席研究官(CRO)拉希德(Rick Rashid)今年10月在中國舉行的一場演講錄像。在錄像中,拉希德展示最新研究成果的英文演講自動轉換成中文,且用同樣的腔調說出。

具體的情形是:拉希德一邊演講,軟體就會辨識他所講的英文,即時將語音轉換成英文字,再翻譯及重組成通順的中文,然後模仿拉希德的聲音語調,以普通話將翻譯內容讀出來,達到同步口譯的效果。

拉希德表示:「這是深部神經網絡(Deep Neural Networks)技術的運用,該技術排列人腦的運作,使研究者能用比過去更好的方式辨識語音。」

微軟解釋,人造神經網絡(Artificial neural networks)是在人類大腦中的低水平電路的數學模型,被應用於語音識別已超過20年,但只是在幾年前,在計算機和統計技術發展到了一定的程度,科學家們才獲得足夠的計算能力,能夠建立細粒度的和複雜的模型, 使得自動語音技術得到認可。

拉希德透露,軟體能模仿他的聲音,是因為研究員事前先將本地中國人的說話內容,以及他本人講英文的錄音輸入電腦進行分析。

拉希德之前曾表示,軟體仍在改善階段,但語音翻譯出錯率已較以往同類技術大幅減少了三分之一。

雖然有些細節仍不夠完美,但拉希德認為,這是一個未來的希望,即使仍有許多工作要做,但他相信這能打破人與人之間語言的隔閡。「數年後,我們希望能夠打破人與人之間的語言障礙。」

相關新聞
韓飛:谷歌價值受認可 市值超越微軟
微軟宣佈Win8開始接受預訂 10月25日上市
微軟平板電腦 499美元起跳
微軟推出Xbox Music 連聽80年不重樣
如果您有新聞線索或資料給大紀元,請進入安全投稿爆料平台
評論