青銅時代語言之謎將能破解?

人氣 64

【大紀元2019年07月08日訊】機器翻譯領域最近取得重大突破,麻省理工和加州谷歌智能實驗室研究人員聯手開發的新程序,首次成功自動翻譯了被稱為線形文字B(Linear B)的一種古希臘文。未曾被人解讀的青銅時代線形文字A(Linear A)有朝一日也可望被機器翻譯破解。

線形文字A。(維基百科)

近年來,大型語料庫支持的機器翻譯使不同語言間的互譯變得程序化,雖然仍有不盡人意的地方,但開闢了分析語言的新視角,徹底改變了原語言學的研究方式。

麻省理工的羅家明(音譯,Jiaming Luo)、巴茲萊(Regina Barzilay)和來自加州谷歌智能實驗室的曹源(音譯,Yuan Cao),聯手開發的機器學習系統(ML)可解讀失傳的文字,已證實可成功機器翻譯線形文字B。機器學習系統是人工智能研究的核心技術。該研究小組採用的方法不同於常規的機器翻譯技術。

機器翻譯的基礎理論是:無論哪種語言,詞彙間的關係有規律可循。因此要先分析語言,繪制出相應的關係圖;並需要建立大型的語料庫,使機器可搜索某個詞語,統計出該詞語和其它詞語一起使用的概率是多少。詞語會在不同的上下文中出現,通過這種方式來限制機器翻譯中不同譯法出現的概率。

但是機器是無法「理解」句子意思的,它只是通過數學算法找出對應關係,選擇出譯文。也就是,詞語可類比做數學中的向量,詞彙的組合類似向量的疊加運算。如把語言類比做空間,相同意思的詞彙在空間中的定位一致,即向量相同,就可以在不同語言間建立起空間對應關係。

但有些語言沒有大型的語料庫。不過若干年前,曾有德國研究人員利用類似的思路,通過增加計算條件限制,翻譯了一些很少使用的語言。

羅家明和他的同伴們做了拓展,通過比對已知語言,進一步增加計算條件,如相關詞語有相同的語序等,用機器翻譯去「理解」尚未被解讀的語言。研究小組測試了線形文字B,結果的準確率出人意料,「線形文字B翻譯成希臘語的準確率高達67.3%」,是「首次自動翻譯線形文字B」。

該項矚目的成果讓人對機器翻譯刮目相看,也想用此技術來破解尚未被人解讀的文字,如線形文字A(Linear A)。雖然羅家明的團隊在發表的論文中對線形文字A隻字未提,但破解線形文字A是所有語言學家的夢想,團隊肯定對此已做了大量的思考,只是仍有很多難題需要突破。

例如,所有試圖用希臘語來破解線形文字A的嘗試均未成功過,沒有對應的語言就沒法設立對應關係,自然無法翻譯。但機器翻譯的優勢是可「不知疲倦」的工作,一種語言嘗試不成功後,可馬上嘗試另一種語言。羅家明的團隊或可用每一種語言來嘗試翻譯線形文字A。

線形文字B是希臘邁錫尼文明時期(Mycenaean Greece )的一種音節文字。1952年,英國語言學家和建築師文特里斯(Michael Ventris)成功釋讀了線形文字B,證明其為希臘語的一種古代書寫形式。線形文字A早於線形文字B,是一種古代地中海克里特島上使用的未解讀文字,出現在青銅時代米諾斯文明時期。◇

責任編輯:李欣怡

相關新聞
希臘--第三種愛
歐洲最古老文字 希臘出土
不僅僅是故事 著名考古學家受神話啓發的重大發現
3600年前古希臘宮殿出土 意義重大
如果您有新聞線索或資料給大紀元,請進入安全投稿爆料平台
評論