本发明涉及装置故障诊断系统领域,具体涉及一种工业控制器故障诊断系统。
背景技术:
1、随着工业系统规模日趋庞大,对控制器的功能与性能提出了越来越高的要求,这直接导致控制器的软硬件也愈发复杂,复杂的软硬件系统在带来丰富功能与强大性能的同时,也在一定程度上增加了控制器发生故障的概率,同时也给故障排查带来了极大的困难。工业控制系统作为工业控制系统的大脑,负责整个控制系统信号的汇聚运算以及输出,其稳定性可靠性直接关乎整个工业生产过程的安全,因此关于控制器故障诊断的研究具有重要意义。目前工业故障诊断方面的研究主要还是集中在整个工业生产系统中,而控制器本身的故障诊断与可靠性的保证主要还是依赖于研发过程的质量管控。
技术实现思路
1、发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种工业控制器故障诊断系统。用于监视控制器状态及快速定位控制器问题。
2、所述系统包括监视系统和工业控制系统;所述监视系统和工业控制系统之间通过冗余以太网链路进行连接;
3、所述工业控制系统用于将控制器运行状态信息通过冗余以太网链路推送到监视系统;
4、所述监视系统对收到的控制器运行状态信息进行分析处理、展示记录,并对异常数据进行告警提示。
5、所述控制器运行状态信息包括网络状态、网络负荷、cpu负荷、内存负荷、背板总线状态和控制器冗余状态,通过读取网卡中相应寄存器收集网络负荷,利用操作系统提供的接口获取cpu和内存负荷,由can bus驱动程序探测背板总线状态。
6、所述工业控制系统包括两个冗余控制器模块、io模块和背板总线,所述冗余控制器模块和io模块通过背板总线进行通讯。
7、所述两个冗余控制器模块包括主控制器和从控制器,如果主控制器异常,从控制器会继续进行控制器的运行状态信息的收集上报,同时将主控制器的异常状态上报给监视系统。
8、所述监视系统包括数据采集模块、数据分析模块、数据展示模块和数据记录模块;
9、所述数据采集模块基于冗余以太网接口接收工业控制系统推送上来的数据;
10、所述数据分析模块负责对数据进行分析处理和故障判别;
11、所述数据展示模块将分析处理完成的数据展示在计算机画面中,对异常数据给出告警提示;
12、所述数据记录模块将需要记录的数据存储到本地计算机的磁盘中。
13、所述冗余以太网链路为双环形冗余以太网链路,监视系统通过两根6类屏蔽双绞线连接到环形冗余链路中的交换机上,控制器系统中的两个互为冗余的控制器模块通过四根6类屏蔽双绞线连接到环形冗余链路中的交换机上;所述环形冗余以太网链路包括一个专用交换机和两个以上普通交换机构成,所述专用交换机中包含一个cpu和一个交换核心,cpu负责环网检测功能,交换核心负责业务数据转发;正常运行时,交换核心其中一个端口是关闭的;cpu有两个网口,cpu周期性地从其中一个网口发送带有cpu唯一id的以太网报文,从另一个网口接收以太网报文,如果未接收到报文或者报文中的id不一致则判定网络故障,立即控制交换核心开启另一个端口,恢复正常通信。
14、所述网络负荷包括单播、组播和广播;所述网络负荷由8个64位数据组成,每个网口占两个64位数据,分别表示输入输出流量,网络负荷分为三种状态:常规工况、调试工况、异常工况;所述常规工况指的是控制器编程完成投入生产后的正常运行工况,调试工况指的是工程师正在对控制器进行组态编程,异常工况指的是控制器流量明显超出正常范围,具体范围由特定控制器型号决定;
15、所述网络状态由四个字节组成,四个字节分别指示四个网口状态,每个字节的最高位表示网口当前状态,0表示正常,1表示异常,低七位表示每分钟网口状态切换次数,其中网口每分钟网络状态切换次数的合理性判定依据如下:0次为正常,1~3次为检修状态,大于3次为网络异常。数据处理模块依据所述合理性判定依据对上传的网口状态数据进行处理并给出状态指示。
16、所述cpu负荷支持对具体cpu核、具体进程进行独立监控;所述cpu负荷由一个变长数据包决定,数据包长度取决于cpu核心数和进程数,每个数据包分为两个以上子数据包,每个子数据包包含类型、线程名称、所在cpu核心、负荷三个字段,包类型占1个字节,线程名称占10个字节,cpu核心占1个字节,负荷占1个字节,包类型分为cpu包和线程包,cpu包不含线程名称字段;数据处理过程中首先根据数据包格式提取各个字段,解析出各个cpu总负荷及线程负荷并进行运算,判断各个线程负荷累加之和是否等于cpu总负荷,然后再逐个判断各个线程负荷是否异常,在常见工况下要求系统单核心运算负荷低于20%,在一些数据同步要求较高的运动控制系统中可能会占用70%以上负荷,具体异常阈值取决于特定应用场景,可以通过监视系统界面设置。
17、所述内存负荷支持对单独进程资源占用进行独立监控;所述内存负荷由一个变长数据包决定,数据包长度取决于进程数,每个数据包包含一个总包头和两个以上子数据包,包头包含总内存大小及总内存消耗,每个子数据包包含包线程名称、内存负荷两个字段,线程名称占10个字节,负荷占4个字节;数据处理过程中首先根据数据包格式提取各个字段,解析出各个内存总负荷及线程负荷并进行运算,判断各个线程内存负荷累加之和是否等于内存总负荷,然后再逐个判断各个线程内存负荷是否异常,在不集成opc ua、profinet主站、dds等内存占用较大的第三方组件的情况下,常规工业控制器应用所占用内存一般不高于50mb,具体异常阈值取决于特定应用场景,可以通过监视系统界面设置。
18、通过采用上述技术方案,本发明取得的有益效果是:
19、通过冗余控制器以及冗余以太网链路,故障诊断信息可以得到可靠采集与传输,极大地降低了因诊断信息的丢失而诊断失效的概率,基于工业控制系统的工作场景特点选取相应诊断信息,基本覆盖常见的故障点,使得故障诊断更具针对性,减少了故障诊断的时间,提升了故障诊断的效率。
1.一种工业控制器故障诊断系统,其特征在于,包括监视系统和工业控制系统;所述监视系统和工业控制系统之间通过冗余以太网链路进行连接;
2.根据权利要求1所述的系统,其特征在于,所述控制器运行状态信息包括网络状态、网络负荷、cpu负荷、内存负荷、背板总线状态和控制器冗余状态,通过读取网卡中相应寄存器收集网络负荷,利用操作系统提供的接口获取cpu和内存负荷,由can bus驱动程序探测背板总线状态。
3.根据权利要求2所述的系统,其特征在于,所述工业控制系统包括两个冗余控制器模块、io模块和背板总线,所述冗余控制器模块和io模块通过背板总线进行通讯。
4.根据权利要求3所述的系统,其特征在于,所述两个冗余控制器模块包括主控制器和从控制器,如果主控制器异常,从控制器会继续进行控制器的运行状态信息的收集上报,同时将主控制器的异常状态上报给监视系统。
5.根据权利要求4所述的系统,其特征在于,所述监视系统包括数据采集模块、数据分析模块、数据展示模块和数据记录模块;
6.根据权利要求5所述的系统,其特征在于,所述冗余以太网链路为双环形冗余以太网链路,监视系统通过两根6类屏蔽双绞线连接到环形冗余链路中的交换机上,控制器系统中的两个互为冗余的控制器模块通过四根6类屏蔽双绞线连接到环形冗余链路中的交换机上;所述环形冗余以太网链路包括一个专用交换机和两个以上普通交换机构成,所述专用交换机中包含一个cpu和一个交换核心,cpu负责环网检测功能,交换核心负责业务数据转发;正常运行时,交换核心其中一个端口是关闭的;cpu有两个网口,cpu周期性地从其中一个网口发送带有cpu唯一id的以太网报文,从另一个网口接收以太网报文,如果未接收到报文或者报文中的id不一致则判定网络故障,立即控制交换核心开启另一个端口,恢复正常通信。
7.根据权利要求2所述的系统,其特征在于,所述网络负荷包括单播、组播和广播;所述网络负荷由8个64位数据组成,每个网口占两个64位数据,分别表示输入输出流量,网络负荷分为三种状态:常规工况、调试工况、异常工况;所述常规工况指的是控制器编程完成投入生产后的正常运行工况,调试工况指的是工程师正在对控制器进行组态编程,异常工况指的是控制器流量明显超出正常范围,具体范围由特定控制器型号决定。
8.根据权利要求2所述的系统,其特征在于,所述网络状态由四个字节组成,四个字节分别指示四个网口状态,每个字节的最高位表示网口当前状态,0表示正常,1表示异常,低七位表示每分钟网口状态切换次数,其中网口每分钟网络状态切换次数的合理性判定依据如下:0次为正常,1~3次为检修状态,大于3次为网络异常;数据处理模块依据所述合理性判定依据对上传的网口状态数据进行处理并给出状态指示。
9.根据权利要求2所述的系统,其特征在于,所述cpu负荷支持对具体cpu核、具体进程进行独立监控;所述cpu负荷由一个变长数据包决定,数据包长度取决于cpu核心数和进程数,每个数据包分为两个以上子数据包,每个子数据包包含类型、线程名称、所在cpu核心、负荷三个字段,包类型占1个字节,线程名称占10个字节,cpu核心占1个字节,负荷占1个字节,包类型分为cpu包和线程包,cpu包不含线程名称字段;数据处理过程中首先根据数据包格式提取各个字段,解析出各个cpu总负荷及线程负荷并进行运算,判断各个线程负荷累加之和是否等于cpu总负荷,然后再逐个判断各个线程负荷是否异常。
10.根据权利要求2所述的系统,其特征在于,所述内存负荷支持对单独进程资源占用进行独立监控;所述内存负荷由一个变长数据包决定,数据包长度取决于进程数,每个数据包包含一个总包头和两个以上子数据包,包头包含总内存大小及总内存消耗,每个子数据包包含包线程名称、内存负荷两个字段,线程名称占10个字节,负荷占4个字节;数据处理过程中首先根据数据包格式提取各个字段,解析出各个内存
