【大纪元2019年07月08日讯】机器翻译领域最近取得重大突破,麻省理工和加州谷歌智能实验室研究人员联手开发的新程序,首次成功自动翻译了被称为线形文字B(Linear B)的一种古希腊文。未曾被人解读的青铜时代线形文字A(Linear A)有朝一日也可望被机器翻译破解。

近年来,大型语料库支持的机器翻译使不同语言间的互译变得程序化,虽然仍有不尽人意的地方,但开辟了分析语言的新视角,彻底改变了原语言学的研究方式。
麻省理工的罗家明(音译,Jiaming Luo)、巴兹莱(Regina Barzilay)和来自加州谷歌智能实验室的曹源(音译,Yuan Cao),联手开发的机器学习系统(ML)可解读失传的文字,已证实可成功机器翻译线形文字B。机器学习系统是人工智能研究的核心技术。该研究小组采用的方法不同于常规的机器翻译技术。
机器翻译的基础理论是:无论哪种语言,词汇间的关系有规律可循。因此要先分析语言,绘制出相应的关系图;并需要建立大型的语料库,使机器可搜索某个词语,统计出该词语和其它词语一起使用的概率是多少。词语会在不同的上下文中出现,通过这种方式来限制机器翻译中不同译法出现的概率。
但是机器是无法“理解”句子意思的,它只是通过数学算法找出对应关系,选择出译文。也就是,词语可类比做数学中的向量,词汇的组合类似向量的叠加运算。如把语言类比做空间,相同意思的词汇在空间中的定位一致,即向量相同,就可以在不同语言间建立起空间对应关系。
但有些语言没有大型的语料库。不过若干年前,曾有德国研究人员利用类似的思路,通过增加计算条件限制,翻译了一些很少使用的语言。
罗家明和他的同伴们做了拓展,通过比对已知语言,进一步增加计算条件,如相关词语有相同的语序等,用机器翻译去“理解”尚未被解读的语言。研究小组测试了线形文字B,结果的准确率出人意料,“线形文字B翻译成希腊语的准确率高达67.3%”,是“首次自动翻译线形文字B”。
该项瞩目的成果让人对机器翻译刮目相看,也想用此技术来破解尚未被人解读的文字,如线形文字A(Linear A)。虽然罗家明的团队在发表的论文中对线形文字A只字未提,但破解线形文字A是所有语言学家的梦想,团队肯定对此已做了大量的思考,只是仍有很多难题需要突破。
例如,所有试图用希腊语来破解线形文字A的尝试均未成功过,没有对应的语言就没法设立对应关系,自然无法翻译。但机器翻译的优势是可“不知疲倦”的工作,一种语言尝试不成功后,可马上尝试另一种语言。罗家明的团队或可用每一种语言来尝试翻译线形文字A。
线形文字B是希腊迈锡尼文明时期(Mycenaean Greece )的一种音节文字。1952年,英国语言学家和建筑师文特里斯(Michael Ventris)成功释读了线形文字B,证明其为希腊语的一种古代书写形式。线形文字A早于线形文字B,是一种古代地中海克里特岛上使用的未解读文字,出现在青铜时代米诺斯文明时期。◇
责任编辑:李欣怡



