1、系统可能出现的问题:
根据我局现在运行的调度自动化系统的具体情况分析,可能出现的问题是:
1)电源系统故障
包括:外部交流电丢失、UPS故障
2)系统崩溃
SD-6000调度自动化系统不能运行或中断,SD-6000调度自动化系统不能实现数据采集、数据存储等功能。
3)通道或站端RTU故障
指通道无信号或站端RTU不能正常工作
2、采取的措施:
2.1 组织措施:
1)成立系统应急处理小组,根据系统出现的问题,请检修人员现场处理。
2)实行检修人员待班制度
3)实行节假日值班制度
2.2 技术措施:
1)定期做好历史数据、数据库定义的备份工作;
2)对系统服务器LF1、LF2进行硬盘径向,保证LF1、LF2的硬盘出现故障时,另外一块硬盘能够立即启动,保证数据采集、数据存储正常。
3)对与华北局进行通讯的节点LF3,PAS节点LF4进行硬盘径向,当LF3、LF4的硬盘出现故障时,另外一块硬盘能够立即启动,保证不会中断计算机通信与PAS高级应用软件。
4)对调度员工作站LF5,DTS调度员仿真节点LF9进行硬盘径向,当LF3、LF4的硬盘出现故障时,另外一块硬盘能够立即启动,保证调度员对SCADA系统的监视和调度员仿真系统的正常。
5)定期对系统软件、应用软件进行备份,并对高级应用软件PAS、DTS的各种参数和定值进行备份。
6)对前置系统中的2台前置机的软件进行备份。
7)对站端的各个不同厂家、型号的当地监控的测控装置、RTU的主要电路板、遥测、遥信板要保留备件。
8)制定调度自动化系统技术应急措施。
3、应急措施:
1)在线SCADA系统崩溃:
如果SD-6000调度自动化系统出现崩溃现象,应做以下紧急处理:
A 通知当值调度员:在线系统崩溃、SCADA系统退出运行。
B 根据系统服务器LF1、LF2出现的故障现象,判断可能出现的问题,如果能立即解决,则解决后,重新启动,试图恢复系统运行。如果不能立即解决,则立即联系相关服务商,马上处理。
C 如果服务器无法启动,则检查其他节点,如果其他节点工作正常,则让调度员用其他节点观察实时数据。
D 如果所有节点都无法启动,则用备份的系统软件进行恢复,如果不能恢复,重新安装操作系统、SCADA应用软件,观察系统能否正常运行。
E 如系统软件、SCADA应用软件不顺利,则立即与南瑞联系调用一台COMPAQ DS20E 作为备用机,暂时代替服务器运行。
2)前置系统崩溃:
A如果前置系统中的2台前置机,任意一台出现故障,则立即切换到另一台值班。
B 如果2台前置机全故障,则重新启动机器,观察是否能正常工作,如果不行,则用备份的硬盘启动,启动后观察是否正常。
3)站端监控系统、RTU功能紊乱:
如果出现监控系统、RTU功能紊乱,不能正常工作,则进行如下处理:
A 召集技术人员,带好备品备件立即赶往故障现场抢修。
B 重新启动RTU,或测控装置,观察系统能否正常工作。
C 如果不行,则更换有故障的插件,重新启动后观察系统能否正常工作。
4)通道故障:
如果出现通道故障,无信号,则应立即切换到备用通道,并且通知有关通信班组处理问题,及时恢复主通道。
4、 系统恢复后需要检查的内容:
1)系统服务器LF1、LF2恢复后,观察是否能值班,重要的进程如:Procman master; scadapro是否存在。如果工作正常,然后检查历史数据丢失的情况,对丢失的数据进行补数。
2)完成计算机通讯的LF3恢复后,检察系统是否正常,再检查“负荷监视”中的“关口数据对照表”中的数据是否刷新,如果不刷新,则检查网络状态,PING 10.10.7.2,即华北局的路由器地址,如果网络通,则在LF3上检查是否有Hbserver这个进程,如果没有则重启此进程。
3)分别检查调度员工作站、高级应用工作站的状态是否正常,是否能够正常启动高级应用的进程,实现其功能。
4)检查模拟屏显示数据是否刷新,如果不刷新则重新启动模拟屏进程,或重启DECSERVER。