語音識別技術重大突破微軟展示英譯中同步口譯

林南

2012-11-1305:22 中港台時間|11-1305:25 更新

人氣 6

【大紀元2012年11月13日訊】（大紀元記者林南綜合報導）微軟（Microsoft）經過兩年時間研發的語音識別技術取得重大突破，除了可準確地把講者所說的英語翻譯成中文，並能模仿講者的聲音語調說出來。一個英語即時譯成中文的同步口譯軟體有望在不久的將來面世。

11 月 8 日，微軟公司研發部門在Youtube上公開了微軟首席研究官（CRO）拉希德（Rick Rashid）今年10月在中國舉行的一場演講錄像。在錄像中，拉希德展示最新研究成果的英文演講自動轉換成中文，且用同樣的腔調說出。

具體的情形是：拉希德一邊演講，軟體就會辨識他所講的英文，即時將語音轉換成英文字，再翻譯及重組成通順的中文，然後模仿拉希德的聲音語調，以普通話將翻譯內容讀出來，達到同步口譯的效果。

拉希德表示：「這是深部神經網絡（Deep Neural Networks）技術的運用，該技術排列人腦的運作，使研究者能用比過去更好的方式辨識語音。」

微軟解釋，人造神經網絡（Artificial neural networks）是在人類大腦中的低水平電路的數學模型，被應用於語音識別已超過20年，但只是在幾年前，在計算機和統計技術發展到了一定的程度，科學家們才獲得足夠的計算能力，能夠建立細粒度的和複雜的模型，使得自動語音技術得到認可。

拉希德透露，軟體能模仿他的聲音，是因為研究員事前先將本地中國人的說話內容，以及他本人講英文的錄音輸入電腦進行分析。

拉希德之前曾表示，軟體仍在改善階段，但語音翻譯出錯率已較以往同類技術大幅減少了三分之一。

雖然有些細節仍不夠完美，但拉希德認為，這是一個未來的希望，即使仍有許多工作要做，但他相信這能打破人與人之間語言的隔閡。「數年後，我們希望能夠打破人與人之間的語言障礙。」

語音識別技術重大突破 微軟展示英譯中同步口譯