2023过年后,公司某套装置CPU出现停机故障,现场维护人员到现场后,发现两个CPU均处于STOP状态,维护人员将两个CPU依次重启后恢复正常,但是我心里开始怀疑(因为正常情况下两个CPU同时停机几乎不可能,不然还怎么冗余),但是此后大概半年没出现过异常,也就没有去管他了,但是7月上旬开始,又开始出现备用CPU停机,巡检人员发现的及时,将备用CPU启动起来了,装置才没有停车。7月下旬又跳机了,而且启动不了,CPU指示灯全亮(闪),这次觉得不对劲了,利用这次机会,将CPU的同步模块,同步光纤都更换了,读取CPU的故障缓冲区,没看出个什么(因为维护人员已经尝试过启动,所有导致两个CPU的故障缓冲区一样了),将项目全部重新下装后开机运行。到了9月份,中间陆续出现过几次备用CPU停机的现象,但是都被巡检人员发现及时启动了。电话咨询西门子,要将CPU的诊断信息导出来查看,初步怀疑CPU硬件有问题。但是因为装置没停车,一直没有去操作。10月份CPU再次停机后,立马要维护人员不要启动,联系西门子技术,利用软件“S7Dump”将两个CPU的诊断信息导出来,以及PCS7里的诊断缓冲区导出来后一并发送给西门子,同时利用此次机会,将程序修改,使用单CPU运行,将经常停机的备用CPU退下来。到现在单CPU运行一直正常(只是有报警指示灯)
一周后,西门子反馈说:诊断信息发德国确认了,备用CPU硬件故障,主CPU没有明显的故障提示,需要更换一对冗余CPU。
此次故障出现也是第一次碰到CPU出现问题,再次注意:冗余CPU运行其中一个CPU出现故障后,先不要尝试启动该CPU,先将故障缓冲去信息读出来后再操作,因为此时两个CPU内的诊断缓冲区是不一样的,主CPU的诊断缓冲区会记录为什么CPU进入单机模式,备用CPU诊断缓冲区中会包含STOP状态的详细信息。如果此时将CUPU恢复冗余,当建立连接并启动重启时,主CPU的完整诊断缓冲区会传送给备用CPU,备用CPU中不再含有STOP的相关信息。
但是,也有一个问题没想明白,备用CPU停机后,为什么主CPU也会停机,就是出现两个CPU均停机的现象?希望各位同行大牛帮忙分析分析。