site logo: www.epochtimes.com

旧金山上周六BART全线停运事故 单个交换机失效造成

3 月9 日,BART 因为计算机网络故障而导致全线停摆数小时。图为BART 车
站月台资料图片。(Justin Sullivan/Getty )

人气: 12
【字号】    
   标签: tags: , , ,

【大纪元2019年03月15日讯】(大纪元记者周凤临综合报导)在3月14日的旧金山湾区捷运(BART)董事会例会上,捷运员工汇报说,上周六发生的全线停运事故,是因为单个网络交换机失效造成数据涌流,引发连锁反应,最终导致整个系统失效。

湾区捷运负责营运的总经理助理塔玛尔.阿伦(Tamar Allen)向董事会称,像上周末这种类型的系统失效是相当罕见的,上次出现还是在2006年。

阿伦介绍说,这是连接列车控制系统和列车设备的一个交换机失效,这属于整个捷运通讯系统的一个环节,而整个通讯系统包含若干个这样的交换机。阿伦称,故障是交换机本身失效,即单个部件失效引发的。

这个交换机故障发生在3月9日(上周六)凌晨2:45左右,故障交换机产生循环数据流造成“数据涌流”(data spike),阿伦说,数据涌流扩散到整个湾区捷运系统,导致湾区捷运营运控制中心与列车设备之间无法联络。

失效的交换机由思科(Cisco)出品,思科公司协助湾区捷运确定了这一故障。

阿伦表示,当时所产生的数据涌流,需要处理的数据请求从每毫秒1个的水平,一下子猛增到每毫秒54,000个,导致整个网络所有的交换机过载。

直到当天上午9时左右,这一交换机故障被清除,整个湾区捷运除帝利市(Daly City)南部的站点外,其它均恢复正常营运。

为防止类似故障引发如此大规模的系统停摆,阿伦表示,办法之一就是安装一个“远程冗余”故障恢复中心,将在一个月内建成。这一由联邦拨款资助的项目在故障发生之前就已经在建。

对于一位湾区捷运董事要求此类故障不得再发生,阿伦回应称,对于大型的数据网络,故障是在所难免的。阿伦说,13日Facebook服务器当机,及源自类似的问题。

阿伦表示,如果建成数据热备份中心,此类问题也许能够避免。

董事会主席贝文.达夫蒂(Bevan Dufty)表示,作为董事会主席,他承认湾区捷运上周六辜负了广大乘客。达夫蒂同时表示,感谢所有员工奋力解决了这个问题。

达夫蒂表示,湾区捷运必须保证此类状况不会再发生,保证系统营运的可靠性。◇

(此文发表于1229E期旧金山湾区新闻版)

要想定期快速浏览一周新闻集锦,请点这里。

评论