首页即时中国美国国际评论台湾香港健康视频听纪元财经科技娱乐文化生活神韵

文章正文

抓垃圾电邮ＩＢＭ请出钟馗

2004-08-26 03:23 中港台时间|2000-01-01 24:00 更新

人气 2

【大纪元8月26日讯】〔自由时报编译张其贤╱综合报导〕美国“国际商业机器公司”（ＩＢＭ )的科学家，运用分析基因序列的技术，开发出一种反垃圾邮件的演算程式，阻挡成功率接近九十七％。

根据英国广播公司（ＢＢＣ )报导，纽约ＩＢＭ华生研究中心的研究人员利古佐斯和田惠恩（译音 )，将基因学家计算蛋白质注解的基因序列时所使用的一种演算程式“泰瑞西亚”，应用到辨识垃圾邮件上，并将这种新的程式命名为“钟馗”。

利古佐斯表示，垃圾邮件会含有某些字元序列模式，这些模式不会出现在非垃圾邮件中。研究人员对大量垃圾邮件进行分析，建立出一套垃圾邮件经常包含的字元序列模式，这些模式相当于某种“字汇”。利用这套字汇组成的资料库，“钟馗”就可以辨识垃圾邮件。

“钟馗”的运算原理是“模式发现”，而非“模式吻合”（如以邮件的来源、途径、身份认证或安全名单等明确资讯串为对象，对邮件进行搜寻过滤 )。只要邮件中出现高频率的垃圾“字汇”，就会被判定为垃圾邮件。

在六万六千封垃圾邮件与二万二千封非垃圾邮件的混合中，“钟馗”成功辨识出绝大多数垃圾邮件，成功率高达九十六点五％。

利古佐斯说，“钟馗”的辨识能力极强，只要“字汇”在邮件中出现两次或两次以上，邮件就会被抓出来，即使出现位置在邮件内容以外的地方也一样。现在许多垃圾邮件以“Ｓ”代替“＄”来逃避过滤程式，但这种障眼法也骗不过“钟馗”。此外，“钟馗”会透过不断学习扩大其“字库”。

“钟馗”所根据的“泰瑞西亚”程式，也是华生研究中心的研发成果。它的命名取自希腊神话中著名的盲眼先知泰瑞西亚，理由是这种演算程式并不知道它所要寻找的明确基因模式为何，它只是在大量的基因资料中，发现到某些反复出现的模式。基因学家利用这些模式，解释疾病与基因缺陷的关系。

标签

相关专题：

如果您有新闻线索或资料给大纪元，请进入安全投稿爆料平台。

留言

大纪元保留删除恶意留言的权利，包括低俗、误导或攻击信仰等内容

本网站图文內容归大纪元所有, 任何单位及个人未经许可，不得擅自转载使用。

Copyright© 2000 - 2026 The Epoch TimesAssociation Inc.All Rights Reserved.

本网站图文內容归大纪元所有, 任何单位及个人未经许可，不得擅自转载使用。

Copyright© 2000 - 2026 The Epoch TimesAssociation Inc.All Rights Reserved.