高可靠大型工业控制系统技术
大型工业控制系统用于大规模的、复杂的技术装备和生产过程,系统内各个部分的关联度相当高,任何一个局部细节出现问题都可能导致严重的后果,造成重大人身伤害、经济损失甚至社会影响,如核电站出现核泄漏等,因此系统的可靠性是这类控制系统最关注的问题。 从总体上讲,可靠性包括了设计、制造、工程安装和运行使用等多个环节,这意味着需要从设计开始就为系统的可靠性打下坚实的基础;在生产制造过程中严格控制质量;在工程中严格按照可靠性保证要求施工;在使用中正确操作、及时维护,为系统提供良好的工作环境;所有这些都是保证系统可靠运行的必要条件。 从技术上看,影响可靠性的关键因素包括:硬件的可靠性、软件的可靠性、网络的可靠性、控制算法的可靠性、使用操作的可靠性及系统维护的可靠性等。 1、硬件可靠性 硬件的可靠性主要有两方面的保证措施:第一是硬件产品的设计和生产方面,其中包括元器件的选用、筛选、老化;参数使用的裕度;电路设计及布线的合理性;严格的生产过程质量控制;机架和机柜的机械结构、防尘、防水、散热、电磁屏蔽等设计与加工。第二是系统结构方面,最重要的手段是采用冗余技术,以保证系统具有更长的不间断运行时间;还需要做到最大限度地解耦,即构成大系统的每个子系统应该保持高度的自律,功能的执行不受部分故障的影响,也不因自己的故障影响部分。 2、软件可靠性 软件的可靠性首先来自软件的正确性,因此软件正确性的验证非常重要。但在大系统中,软件是十分庞大的,严格证明一个庞大的软件是否正确是不可能的,因此要从软件的设计开发全过程的各个阶段实行严格的验证与确认(即VV),并实行严格的版本控制和配置管理。在软件方法上,应该尽量避免软件技巧的使用,如多重循环、嵌套调用、递归、共享代码、动态内存分配等,因为这些技巧在大规模的软件系统中会成为排查问题的最大障碍。大规模软件最难解决的问题是各个功能模块的相互关系,包括功能关系、信息传递、执行的时间顺序等,如果加上编程技巧带来的问题,将造成不可收拾的后果。 3、网络可靠性 网络是系统的骨架,应该是系统中最坚固的部分,因此应该选用技术最成熟、产品最可靠、标准化程度最高,最简单实用的网络系统。在整个系统中,最关键的是要有一个稳定的、全系统统一的、有强大实时通信能力的网络规约。与一般信息系统的网络不同,在控制系统中,不主张采用信息种类太多、功能过于复杂的规约,因为网络是信息十分集中的地方,一旦出现问题将影响全局,因此在设计上尽量将复杂的功能放到网络的末端去处理,如控制终端、计算终端、人机界面终端等。 4、控制算法 控制算法指对被控对象的控制方案,包括数学模型、逻辑关系、时间顺序等。控制方案要符合被控对象的特性,同时还要考虑到各种异常工况的应对。一般情况下,算法的错误在系统调试中会很快被发现,但异常工况的处理则不太容易考虑完善,有些系统甚至运行了多年还存在这方面的漏洞。这只有依靠经验丰富的系统分析人员进行仔细慎重的设计和工程实施,并在运行中仔细观察,不断及时完善设计,才能够避免事故的发生。 5、使用操作 大型控制系统在使用操作方面的要求是十分严格的。对于操作人员来说,正确的使用操作是保证系统正常可靠运行的必要条件。系统一般都设计了不同的操作权限和范围,不允许进行超越权限或范围的操作,这在一定程度上避免了因操作不当造成的系统故障。 6、系统维护 一个好的控制系统,除了本身的设计、生产质量外,还需要有良好的系统维护,才能够使系统长期可靠地运行。要做到及时维护,系统要有完备的自诊断功能,使维护人员能够尽快全面了解系统的运行状态和出现异常的部件,以采取必要的措施,另外经验丰富的维护人员对系统的运行情况进行及时准确的分析与判断也是极为重要的。 和利时公司经过多年的技术积累和几千个工程现场的工程经验积累,已经具备了很强的大型高可靠性控制系统的设计、工程实施、运行指导和运行维护能力,在和利时所承担的大型控制系统中,有核电站计算机监视控制系统、城市轨道交通综合自动化控制系统、大型火电站综合控制管理系统等。其中规模最大的系统有物理检测点近20万个,所使用的计算机上百台,系统可对分布在几十公里范围的各种对象进行控制。下图是和利时公司为某城市地铁提供的综合自动化监控系统的总体图。