12月1日晚八点二十接到生产现场通知一号机设备全部停机,去现场查看硬件诊断,MRP环网故障,紧接着全部IO链接失败,3秒钟后全部IO设备自动恢复链接,CPU为1517H,环网交换机使用的东土,下面带了有40个左右的SP子站,当时第一反应是两个环全部失效,问题可能是两个CPU下网线问题,先更换了西门子专用网线和接头,一直到3号,中间报MRP环网故障多次,但IO设备未掉站,设备未停机,发生两次全部IO设备链接失败问题,问题依然没解决。
故障为两种情况:1.报环网故障,所有IO设备链接失败。2.报环网故障,IO设备不掉站,环网故障几毫秒自动恢复。
后与厂家共同排查问题发现三个问题点:
1.硬件组态中的两个交换机的GSD文件不对,且未配置环网端口。
2.发现其中一个接口模块网口指示灯闪烁,更换接口模块。
3.测量所有光纤光损,有两处光损超过-25,重新熔接光缆控制光损在10以内。
处理完以上三个问题目前运行4天未发现异常。
总结:1.感觉以上排查的三点问题不至于导致两个环全部断开导致所有IO设备掉站。
2.报环网故障大概3毫秒自动恢复,不能快速准确定位MRP环网中断点位,有没有什么方法快速锁定中断点。
3.环网设计注意事项?假如CPU下带4个区域的远程站,使用整个大环设计?还是环带环方案?怎么设计可以减少故障区域和方便故障排查。