退党网络系统软体开发和分析结果报告

在洛杉矶声援1100万“三退”大潮集会上的发言

人气 2

【大纪元6月11日讯】各位到会的女士们、先生们、朋友们﹗
  
我在这里代表南加州Quality Software Developer (QSD) 软体开发公司向各位报告一下我公司承蒙全球退党服务中心和大纪元退党网站的授权,开发退党网络数据分析的人工智能软体、就1100万人次的三退声明(即退党退团退队)的文字数据进行检索分类的情况和分析结果,并就该网络分析系统在开发设计中大家所关心的一些问题作出简要的说明。
  
大家知道,自从2004年12月4日这一天首次109人在大纪元网站上公开发表退出中共及其相关组织以来,直到今年的6月4日为至,整整18个月,一年半的时间,550个日日夜夜,到今天6月9日,正好是555天。这期间在中国大陆的各个阶层持续而稳定地出现了退党退团退队的三退浪潮。它触动了中国社会的各个阶层,也引起了国际社会的关注。到今天为止,大纪元退党网站上发布的三退总积累人数超过1099万。那么,在这里海内外各界人士一直关心着这样一个问题,就是在这趋近1100万的三退人群中,有多少是中共党员﹖
  
针对这样一个人们所关心的问题,我公司有幸承蒙全球退党服务中心和大纪元退党网站的授权,最近成功地开发了退党网络在线实时分析系统最新版本, Quitting CCP Internet Data Real Time Analyzer, Ver1.0, 并于日前投入运行,对三退网络数据进行了检索分析。今天借此声援1100万同胞退党集会的机会,正式向大家发表我们检索统计分析的结果如下。
  
通过我们的网络分析系统对于2004年12月4至2006年6月4日期间550天的所有三退声明数据进行电脑人工智能检索分析,结果表明:在总数为10,894,981(截止6月4日下午6时51分美西时间)的三退人数中,有6,589,648人为中共党员的退党人数,占总三退人数的60.5%, 退团和退队的人数分别占16.3%和13.3%。由于中文表达的复杂性等因素令电脑分析系统不能确切判定的缘故,目前尚有1,078,693人次的声明被暂时分类于待定的范围。如果考虑到这107万未确定的三退人群中尚含有一定数量的党员退党数字,可以说这个60.5%的退党百分比是一个最低保守数字,而实际的退党人数可能超出660万这个保守数字,也就是说,可能有700万中共党员在过去的一年半中退出了中共组织。

总三退人数10894981 占100%
退党人数 6589648 占60.5%
退团人数 1773265 占16.3%
退队人数 1450375 占13.3%
未确定人数 1078693 占9.9%

Quality Software Developer (QSD)软体开发公司在全球退党服务中心、大纪元退党网站的授权下,成功地独家开发了退党网络在线实时分析系统最新版本, Quitting CCP Internet Data Real Time Analyzer, Ver1.0, 并于日前首度投入运行,对三退网络数据进行了授权下的独立检索分析。

也许许多朋友有兴趣了解我们是如何用电脑分析这些文字数据和如何得出上述分析结果的。据说一些朋友很长时间以来一直辛苦地用人工阅读一个个记录的方法对这1100万三退声明进行分类清点,想了解到底有多少人退党、多少人退团队。但是因为数据量实在庞大,使人工检索几乎成为不可能。那么我们近日投入运行的网络分析系统,相比之下比人工检索具有许多优越性。
  
在性能方面,我们的网络分析系统具有高速人工智能汉语分析能力,具备对数以千万计的三退网络资讯进行准确快捷的检索、分类和统计分析的功能,目的在于对数量庞大并继续快速增加的网上三退声明的文字资讯进行分类检索,以满足海内外各界人士一直对三退人数中实际中共党员人数的真实分布情况的迫切关注;同时可以帮助海内外政治经济文化等各个阶层人士对于中国大陆出现的三退大潮的实际状况、未来趋势、对于国内事态及国际社会的影响等方面作出客观的和科学的评价和判断;也同时对于中共内部尚未退出相关组织的人士及时作出正确的选择提供参考资讯。
  
那么我们是如何对三退声明的文字进行检索分析,并保证其结果的准确性的呢﹖我想在这里简要地介绍一下我们在该软体设计上的一些基本原则性考虑和程序化过程。大家知道,人类语言(包括人类的文字语言),与电脑语言有着很大不同,它并不是一种确定的线性形式的信息,尤其是中文的表达方式多样而复杂,这对于开发分析中文语言文字的电脑软体来说,在技术上提出了一个一定程度的难题。对于三退声明的文字分析这一特定目的的软体,我们首先采取人工的方法阅读大量的三退声明的文字数据,对于人们各种可能的表达方式、语法结构、用词特点、标点使用、以及人们的语言心理过程等进行分析和分类。然后针对这些尽可能的语言模式设计出电脑分析用的各种过滤器。当文字信息经过这些过滤器时,它们将被自动筛选分类。
  

2004年12月4至2006年6月4日期间,退党、团、队人数分别占总三退人数的60.5%、16.3%和13.3%。


  
那么这些过滤器实际上是一些关键词的前后不同组合,比如:对于退党的一些可能说法,就可能出现以下字样﹕退党、退出共产党、退出邪恶共产党、退出邪党、退出恶党、退出中共、退出早年加入的共产党、我曾加入过共产党,现在退出、我是中共党员,现在声明退出,等等等等,这里不一一列举。考虑许许多多的可能说法,再加上相关词的先后搭配来分析其说话人的意思。而对于有一些说法并不确切指出是退党的,我们的软件就不将其列入退党类,比如声明中说﹕“退出中共邪恶组织” ,“退出中共一切相关组织”,这里也可能是指退团退队的,当然也有可能包括退党。但因为不明确,我们的分析系统就暂时将其列入不确定类。
  
也有许多声明有退党、退团、退队在同一个短句或段落中出现。这时我们的软体在对于整个声明进行解读和分析之后作出判断﹕凡是声明人同时声明退党、退团、退队的,就将其分为退党类;凡是声明人同时声明退团、退队的,就将其分为退团类;当然只是声明退队的那么就是退队类。句子中退党、团、队的顺序可能各有不同,但根据其所退最高中共组织而分类。
  
对于同一声明中多人声明退党团队的,需要逐字分析哪些人属于退党,哪些人是退团或者退队的。有时声明人写到﹕退党人:XXX,XXX,XXX,列出人名。那么我们的软体可以清点人数而将其归入退党类。人名可能以逗号分开,也可能以顿号、甚至个别的也有用其他标点分开的。有时是中文的标点,也有时是英文的标点,这都要加以区分方可准确无误地数清人数。在人名前的引导词,也可能是各种说法,比如,“退党声明人:”,“退党团队人:” ,“退党、团、队人:” ,“退党,团,队人:” ,“退党退团退队人:” ,等等,许多可能都要考虑进去。这里就不去一一列举了。总之,我们的软件工程师竭力将各种中文的语言表达方式“教”给电脑,让它掌握识别分析此类中文语句的能力。
  

2004年12月4至2006年6月4日期间,退党、团、队人数的逐月分布曲线。退党曲线上升的月平均斜率为12040/月。


  
我们在开发退党网络数据分析系统的过程中,阅读了大量的退党声明的内容。这些退党声明的内容给予我们极大的鼓舞,如此庞大的真实文字数据,不仅使我们看到了中国大陆退党现象的真实性,我们也被那些中共内部醒悟后的同胞那种毅然决然而又刻不容缓的退出中共的迫切心情所感动,深深感到中国大陆出现的退党大潮是一件历史意义重大的民族精神觉醒运动,一个有着五千年中华民族传统道德基础的民族遭受近一个世纪的外来邪灵控制,今天终于开始苏醒过来,这让我们感到非常欣慰。
  
我们的网络分析系统对于过去整整555天的退党大潮中对每一天每一个记录进行逐字分析,我们的面前掠过一个个以日期、时间分秒、人名、地区、声明人数、声明全文为记录项目的真实文字数据,有的是一个人退党,有的是成群结队上百人集体退党,有的是真名实姓退党,有的是暂时匿名退党,有的是在海外和平环境里退党,而绝大多数是在中共严密控制下甚至冒着生命危险而上网或在托人上网声明退党退团退队。
  
由于上网速度本身的局限和检索程序对于一条中文记录进行多层过滤分析的复杂化,面对如此庞大的网络数据,即使我们快捷ONLINE检索的分析软体系统以每小时10万以上的速度进行检索分析,也要足足100多个小时的昼夜不停的运行,才能完成一次检索过程。这1100万三退声明的文字数据,白纸黑字,真真切切,写下了中华民族自我觉醒、走向自由民主的不可磨灭的历史。这期间,那些不惜代价为传九评、劝三退和为了每日两万有余的大陆退党人士提供服务的全球各地退党服务中心和退党网站的义工们,作出了大量的付出和辛苦劳动,我们对这样庞大的网络数据进行分析的过程中,深深为他们的工作和付出感到钦佩。
  

过去一年半期间550天逐日退党﹑团﹑队的分布曲线。退党数据分布具有总三退数据的分布特征﹐代表了三退的主体。


  
我们正是受到这些人们的精神力量的鼓舞,才得以有信心和耐心一次次地修改和完善着我们的软体原程序,最终顺利地完成了我们网络分析系统的处女版。我们对我们的软体及其分析结果的准确性和较低的误差程度具有足够的信心,我们曾经对现有分析结果,通过部分人工阅读分类的方法加以评估,结果与我们的电脑软体分析结果基本吻合。我们在编程中和运行的过程中,设计了随时随机抽样的人工监测方法,这样在系统试用运行和实际运行的过程中,我们都可以对于检索分类的准确性有一个比较直观的了解,并作出随时修正和改进。今天我们有信心在这里发布我们的检索结果,向大家报告,在1100万人次的三退人群中,有60.5%左右,即有660万到700万中共党员退党,而16.3%和13.3%左右的人分别为退团和退队。希望我们的分析结果对于各界人士提供有价值的参考。我们还将继续努力,对于那些尚未确定分类的占总三退人数9.9%的100万三退声明进行更高一级的分析检索。我们在升级我们软体的版本,正在设计一种更为合理、准确、快捷的检索系统,降低误差或不确定分类的比例。
  
谢谢今天到会的各位朋友的付出、参与、支持和关注。谢谢关心中华民族兴衰存亡的每一个中国同胞和每一个爱好和平自由的国际朋友对中国大陆出现的三退大潮的付出、参与、支持和关注。 ◇
(http://www.dajiyuan.com)

相关新闻
李大卫:从五四运动到九评退党大潮(九)
梅酉:中共已是一具无头尸
洛华人周六集会声援1100万"三退"大潮
寒坡岭:慕尼黑纪念六四屠杀17周年活动
如果您有新闻线索或资料给大纪元,请进入安全投稿爆料平台
评论