第589章 扫尾(1/2)
正月初四一过,吕辰就扎进了昆仑1的机房,再没出来过。
先是各种故障测试,接着又是微程序全覆盖校验。
到了正月十六,2月21日,墙上的“软硬件接口对照表”已经打满了绿色的勾,只剩下最后几行空白,像待填的棋盘。
陈茂林站在表前,双手背在身后。
“进度怎么样?”
“还剩最后127条。”吕辰拿着一个本子,“预计三天之内能跑完。”
陈茂林点了点头,接过本子。
应急模拟演练、使用说明书编写、机组人员培训,三项并列,进度参差不齐。
“演练的事,你盯着。说明书和培训,我负责。”
吕辰点了点头。
微程序全覆盖校验,是交付前最后一道硬门槛。
汪涵教授把团队分成三组,每组负责1600多条,三班倒,人停机不停。
吕辰来到终端前,卫知南靠在椅子上,眼睛里全是血丝。
“怎么样了?”吕辰蹲下来,看着终端屏幕。
“最后一批了。I/O通信协议栈,最后37条,今天上午能跑完。”
屏幕上,绿色的字符一行一行地滚,每一行都是一个测试用例的结果。
全部都是PASS。
卫知南从椅子上站起来,活动了一下僵硬的脖子,拿起一个记录本,递给吕辰。
“全部跑完一轮了,这是第三轮回归测试,改过的微程序重新验证。”
吕辰接过本子,翻开。
每一页都密密麻麻写着测试记录,时间、操作人、微程序编号、测试结果、问题描述、解决方案。
字迹工整,每一条都有签字。
他翻到最后一页,上面写着几行字:
“第三轮回归测试完成。4863条微程序,全部通过,无新增问题。”
“汪教授人呢?”
“在4号机柜。”卫知南用手指了指,“盯最后几条I/O中断的时序,已经盯了四个小时了。”
吕辰来到4号机柜后面,汪涵教授手里拿着示波器的探头,夹在总线信号线上。
屏幕上的波形稳定,方波边缘干净,没有毛刺。
“汪教授。”
汪涵抬起头,眼睛
“最后一条。”他说,“I/O中断响应,连续触发次,没有一次超时。”
他把探头收起来,站起来的时候晃了一下,扶住机柜才稳住。
“汪教授,您去歇会儿。”
“不歇了。”汪涵把示波器的电源关了,探头绕好,放回工具箱,“我要看着它跑完最后一条。”
他走到终端前面,敲了一行命令。
屏幕上跳出一行绿色的字符:
ALLMICROCODEVERIFIED.4863INSTRUS.0ERRORS.
汪涵盯着那行字看了几秒,然后拿起桌上的记录本,在最后一页签了字。
他把笔帽拧上,放回兜里。
“微程序全覆盖校验,完成。”
应急模拟演练,分两大类:技术故障类和安全威胁类。
技术故障类分单板卡故障、单机柜故障、全系统级灾难三级。
每级若干子项,一共47个故障场景。
每一个场景都要有详细的脚本,故障怎么注入、怎么发现、怎么定位、怎么恢复、恢复后怎么验证。
安全威胁类涵盖防空、防暴、防火、反侦察、防爆五个维度,一共23个演练科目。
先是单板卡故障,郑长枫从工具箱里拿出那块自制的故障注入板,串在I/O总线上。
“第一个场景,I/O板输出驱动芯片失效。”
然后拧动了信号发生器的一个旋钮。
机柜前面板的黄色“故障”灯亮了,七段数码管显示了一组数字:06-03-02。
第六号机柜,第三块板卡,第二槽位。
吴国华走到机柜前面,根据数码管的提示,找到了那块板卡,按下锁紧机构,抽出抽屉,换上备用板卡,推回去,锁紧。
整个过程不到两分钟。
系统没有重启,任务没有中断。
终端屏幕上的数值还在跳动,仿佛什么都没发生过。
I/O板卡热更换,2分10秒,达标。
接着是存储板ECC纠错上限。
郑长枫在数据总线上注入了连续的双比特错误,这是ECC能纠正的极限。
诊断系统报出了警告:UNCORRECTABLEERRORDETECTED.DATARESTOREDFROM
BACKUP.
系统从备份副本中恢复了数据,任务继续运行。
没有死机,没有数据丢失。
接着又是单机柜故障,这是更严酷的考验。
郑长枫直接拉下了一台存储机柜的总电源。
“嘭”的一声,六台存储机柜中的一台彻底黑了。
机柜前面板的红色故障灯亮了,诊断面板显示“ST-03OFFLINE”。
主控核心在0.5秒内检测到了故障,将原本分配给这台机柜的存储请求,全部重新路由到了其他五台机柜。
终端屏幕上的任务输出没有中断,甚至没有任何延迟。
吴国华走到故障机柜前面,打开柜门,检查了一遍,确认没有硬件损坏,然后重新推上电源。
机柜启动,自检,重新上线。
诊断系统自动将这台机柜加入存储池,恢复数据同步。
整个过程不到五分钟。
单机柜断电,系统无感知恢复,4分50秒。
……
全系统级灾难,这是技术故障演练的最后一个场景,也是最极端的一个。
模拟主控核心软件死锁。
郑长枫在终端上敲了一个命令,模拟主核心进入死循环。
辅核心在3个心跳周期后检测到了异常,自动接管了控制权。
黄色的“接管”指示灯亮了,绿色的“运行”灯没有灭。
终端屏幕上的任务输出没有中断。
然后是模拟全厂断电。
郑长枫拉下了机房的的总配电开关。
所有的灯光、所有的指示灯、所有的风扇,在一瞬间全部熄灭了。
机房陷入了短暂的黑暗,只有应急灯昏黄的光。
然后,柴油发电机组启动了。
轰鸣声从地下传来,像一头被惊醒的巨兽。
35台机柜的绿色指示灯依次亮起来,像多米诺骨牌。
从一号机柜到三十五号机柜,从左边传到右边,用了不到30秒。
系统从最后一次检查点恢复了任务。
终端屏幕上的数值继续跳动,仿佛那场断电只是一次短暂的眨眼。
如此每日循环往复,持续做了七八十轮。
整个集成组50多名成员,加上昆仑1机的机组人员,轮番上阵。
吕辰甚至把在红星轧钢厂防静电车间组装的测试机柜般了来,配置了一个最小系统,进行各种极端故障抢修模拟。
安全威胁类,是纯军事环节。
本章未完,点击下一页继续阅读。