摘要
“狼來了”是大家耳熟能(néng)詳的寓言故事(shì),這(zhè)則寓言對(duì)那些仍在麻痹中祈禱、賭運氣的危化品企業很有啓示意義。“安全關鍵報警”扮演了故事(shì)中的“牧童“角色,操作員則相當于故事(shì)中承擔施救任務的“村民”。而漠視“安全報警”的風險代價遠遠超乎普通人的直覺認知,報警響應失效釀成(chéng)的慘禍不再隻是頭腦中的想象場景,屢屢發(fā)生的工藝(過(guò)程)安全事(shì)故就如同“狼來了”的故事(shì)結局,悲劇場景在現實中的一幕幕地重演。
那麼(me)要如何才能(néng)築牢報警響應這(zhè)第一道(dào)事(shì)故防線?表表決心、喊喊口号等形式主義的做法顯然于事(shì)無補,甚至适得其反。本文介紹了基于标本兼治的體系化解決之道(dào)。簡言之,危化品企業應基于ISA18.2/IEC62682标準,建立實施涵蓋報警系統生命周期各階段有效的報警管理體系,并配套應用專業的智能(néng)化先進(jìn)報警響應管理系統軟件(如北京思創的SARMS),從而幫助操作員提高響應效能(néng)。
一、工藝(過(guò)程)安全事(shì)故教訓和報警響應失效機制
ISA-18.2 / IEC 62682标準中的術語“報警”專指向(xiàng)操作員指示設備故障、工藝偏差或其它需要及時響應的異常情況的視聽刺激手段。
應确保報警系統以正确有效的方式和時間提供正确的信息,以使控制室操作員及時洞察險情并采取正确的響應行動以糾正異常工況,從而避免事(shì)故或盡量減緩後(hòu)果(人身傷亡、設備故障、資産或環境損害)。
絕大多數情況下,“自動報警+人工響應”都(dōu)是抵禦重大安全事(shì)故的第一道(dào)重要防線。迄今爲止,國(guó)内外所有的工藝(過(guò)程)安全事(shì)故的原因幾乎都(dōu)可以追溯到報警響應這(zhè)一防線的失守。報警響應失效釀成(chéng)的慘禍不再隻是頭腦中的想象場景,傳說中“狼來了” 的故事(shì)一次次在現實中重演,其中典型的事(shì)故如下:
1994年英國(guó)Milford港Texaco煉油廠爆炸
2018年1月22日美國(guó)Pryor Trust井噴事(shì)故
2005年3月23日BP Texas City煉油廠大爆炸
吉林石化雙苯廠硝基苯精餾塔11.13特大爆炸
報警響應安全防線由如下圖所示的三大子系統組成(chéng),依次完成(chéng)偵察險情-診斷決策-響應動作三項任務,缺一不可,其中任一環節失效都(dōu)會導緻整體防線的失守,從而導緻報警響應的失效機制。
上圖中的硬件(傳感器、DCS/PLC控制站、執行器和HMI操作站硬件)失效在PSM(工藝過(guò)程安全管理)體系中屬于設備完整可靠性管理的要素範疇,在此不作闡述。衆所周知,有效的操作人員對(duì)最大限度地提高生産效率、産品質量和生産裝置的安全可靠性至關重要。而且,目前存在一個自動化和人因可靠性之間的悖論,即自動化程度越高、範圍越廣越可靠,操作員越盲目樂觀,重要線索越容易被(bèi)忽視或誤解。自動化系統一但有故障,對(duì)操作員的要求反而越高。然而,操作員的人因失效除了受制于報警的可靠性,還(hái)涉及到PSM的COO/OD(運維管理和紀律)、SOP(标準操作規程)、培訓和績效保障、應急響應等多個要素,在此也不詳細讨論。本文讨論重點是和操作員響應有密切關聯的HMI和相關報警軟件如何爲操作員提供有效的幫助,以完成(chéng)以下三大任務環節:
1、偵察(傳感設備+HMI+視聽刺激+人工觀察):報警信息如何有效幫助操作員透過(guò)現象(視聽刺激),洞察本質(事(shì)故因果劇情)?
2、診斷(HMI+人腦思考):報警信息如何提供明确充足的決策分析依據(例如危險劇情、優先級和響應時間)?
3、響應(人工+執行設備):響應規程聯動如何幫助操作員執行決策并密切觀察幹預效果反饋?
二、自控系統内置報警功能(néng)的典型症狀:泛濫低效
DCS等自控系統内置報警功能(néng)存在以下幾種(zhǒng)妨礙操作員響應性能(néng)的典型症狀:
報警洪災。
高頻(抖顫)報警。
滋擾報警。
HMI設計不良。
報警管理不善。
報警信息孤島。
模拟儀表時代,每名操作工每個班次平均收到100條報警,而DCS普及後(hòu)的數字化時代,報警設置變得異常容易方便,導緻報警數量急劇增加!每名操作工每個班次平均收到4000條以上的報警,遠遠超過(guò)操作員能(néng)夠從容應對(duì)的設計負荷限制。這(zhè)帶來了新的難題和挑戰,面(miàn)對(duì)頻繁、甚至泛濫)且無類别和優先級劃分的報警事(shì)件, 操作員沒(méi)有能(néng)力對(duì)隐藏其中的真正險情臨時做出正确的診斷評估和及時的響應決策,大量無關緊要的滋擾報警(如同“牧童的謊報”)令日趨麻痹的操作員(如同“村民”)完全漠視報警,甚至違規全面(miàn)抑制(屏蔽)報警功能(néng)。而當險情真正降臨時(“大灰狼真來了”),操作員面(miàn)對(duì)報警洪災而不知所措(如1994年英國(guó)Milford港Texaco煉油廠爆炸事(shì)故),甚至因違規關閉報警系統以緻于操作員對(duì)近在咫尺的險情毫無察覺而束手無策(如2018年1月22日美國(guó)Pryor Trust井噴事(shì)故),最終釀成(chéng)慘重事(shì)故。
三、ISA18.2/IEC62682報警生命周期管理體系:标本兼治之道(dào)
如何築牢報警響應這(zhè)第一道(dào)事(shì)故防線呢?答案是通過(guò)有效的報警管理提升操作員的響應性能(néng)。那麼(me)如何管理才稱得上有效呢?有效解決方案就是建立實施基于ISA18.2/IEC62682标準的涵蓋報警系統的全生命周期各階段(識别與合理化、設計、采購和實施、運行維護、性能(néng)監測評估、變更管理、體系審計和改進(jìn))的基于PDCA内外雙循環的報警管理體系,并配套應用專門的智能(néng)化先進(jìn)報警響應管理系統軟件,從而爲操作員創造一個能(néng)夠及時正确偵察感知、診斷和響應報警的良好(hǎo)環境。這(zhè)是解決本文上一章所列舉的自控系統内置報警功能(néng)各種(zhǒng)典型症狀的标本兼治之道(dào)。
本文第二章列舉了DCS等自控系統内置報警功能(néng)的各種(zhǒng)典型症狀,其共同根源可以歸結爲缺乏上圖所示的報警管理體系,具體主要表現在以下方面(miàn):
首先,沒(méi)有制定報警導則和開(kāi)展各項活動所需的詳細規程,報警未經(jīng)合理化分析而随意設置,導緻報警數量太多且無類别和優先級劃分,報警點的設定僅憑經(jīng)驗直覺而缺乏基于PST(工藝過(guò)程安全時間)和可容忍響應時間的計算依據,HMI報警顯示界面(miàn)上無完整的危險劇情和明确具體的響應規程。
其次,自控系統内置軟件無報警管理功能(néng),對(duì)其KPI(關鍵性能(néng)指标)無法進(jìn)行持續的監測評估和統計分析,從而無法對(duì)報警合理化的結果和後(hòu)續的設計做針對(duì)性的優化調整(變更),也未開(kāi)展體系審計以形成(chéng)良性的PDCA循環。另外,除一線操作人員外,管理層對(duì)報警及其處置情況無法及時了解,不利于生産調度和決策指揮。
盡管操作員的可靠性還(hái)涉及操作規程、培訓及演練、操作管理和紀律等PSM(工藝過(guò)程安全管理)要素(非本文讨論範疇),但如本文第二章所述,報警系統自身的性能(néng)直接影響操作員的偵察和診斷決策的可靠性。美國(guó)CCPS在一篇專著指出:KPI(性能(néng)指标)不受監控的報警系統在本質上屬于薄弱低效的系統,有時甚至幾乎等同于完全損壞(無效)。對(duì)報警系統缺乏有效管理和監控會導緻報警泛濫低效常态化,進(jìn)一步迫使操作員随意抑制報警,最終使得報警響應這(zhè)第一道(dào)事(shì)故防線幾乎形同虛設!
特别需要注意,對(duì)報警系統KPI的實時監測和周期性精準統計分析是确保報警管理體系PDCA循環的關鍵保障,而通過(guò)人工方式不僅效率低下,而且僅能(néng)統計一到兩(liǎng)項簡單指标(如前10位頻繁報警),準确度、計劃性和及時性也不夠高。因此,需要依托專業的智能(néng)化先進(jìn)報警響應管理系統軟件(比如思創公司開(kāi)發(fā)的SARMS軟件)自動監測統計分析下表所示的多項報警系統KPI(關鍵性能(néng)指标)基準(至少統計30天):
要改善上表中的KPI,尤其是要減少報警數量,必須确保ISA18.2/IEC62682報警生命周期管理體系形成(chéng)PDCA良性循環,其中有兩(liǎng)項任務極其關鍵,即持續的報警KPI性能(néng)監測與報警合理化。
一是對(duì)每一個報警信号(尤其是報警率高的信号)開(kāi)展正規的合理化分析,以确定該報警是否必要,另外對(duì)報警進(jìn)行分類,并計算報警設定值、确定報警優先級,然後(hòu)進(jìn)行基本設計(設置報警死區、延遲時間等屬性與參數),必要時采用先進(jìn)(增強型)報警設計方案。
二是安裝智能(néng)化先進(jìn)報警管理系統軟件(如北京思創的SARMS),對(duì)每套裝置的報警信号實時在線統計分析,發(fā)現并消除滋擾報警、陳舊報警、頻繁報警、報警洪災等,對(duì)報警系統持續進(jìn)行優化(返回合理化和設計階段),降低報警率。需要注意,報警合理化并非一次性工作,而是基于持續的報警KPI性能(néng)監測和周期性(7~30天)統計分析反饋結果而相應重複開(kāi)展的活動。
四、SARMS智能(néng)化先進(jìn)報警管理系統軟件:報警管理體系有效實施的必備工具
綜上所述,ISA18.2/IEC62682報警生命周期管理體系是針對(duì)自控系統内置報警功能(néng)各種(zhǒng)典型症狀的唯一的标本兼治之道(dào),爲操作員創造能(néng)及時正确偵察感知、診斷和響應報警的良好(hǎo)環境以提升操作員響應性能(néng)奠定了基礎,是築牢報警響應這(zhè)第一道(dào)事(shì)故防線的根本前提。那麼(me)企業應如何踐行ISA18.2标準呢?首先是對(duì)相關人員開(kāi)展必要的培訓,然後(hòu)制定APD、報警系統KPI基準、ASRS以及各階段活動的管理和技術規程,最後(hòu)根據規程開(kāi)展各階段活動。
對(duì)于新企業或新建項目可按照ISA18.2報警生命周期流程圖中的順序從APD開(kāi)始進(jìn)入PDCA循環;對(duì)于已有APD的企業的新建項目,可以從報警識别與合理化階段進(jìn)入DCA-PDCA循環,或者先對(duì)APD做審計更新後(hòu),再做報警識别與合理化(CA-PDCA循環)。
對(duì)于現役報警系統,則宜采用CA-PD(ca-pdca)CA方式啓動技術改造項目,即不從P階段開(kāi)始,而首先開(kāi)展C(檢查)和A(改進(jìn))階段的活動,通過(guò)對(duì)企業報警管理現狀和現役報警系統的實際性能(néng)表現做初次摸底調查與分析評估,從而爲設定适當的改進(jìn)目标提供依據,爲後(hòu)續的PDCA良性循環提供一個啓動基準。
具體的做法是,首先依據ISA18.2/IEC62682标準對(duì)報警管理現狀的進(jìn)行初次宏觀審計(基于粗略的檢查表),同時依托專業的智能(néng)化先進(jìn)報警響應管理系統軟件對(duì)現役報警系統的KPI(關鍵性能(néng)指标)開(kāi)展監測與分析評估(至少統計30天的數據),再根據審計和監測評估結果以及企業願望和資源情況來确立報警系統的KPI初始基準。完成(chéng)了上述初始CA階段活動後(hòu),就可以正式進(jìn)入首輪PDCA循環,完成(chéng)後(hòu)再重複下一輪PDCA循環,周而複始并持續改善提高(建議周期不超過(guò)1年)。具體工作内容參見本文第二章。
無論是新建項目還(hái)是現役報警系統,都(dōu)必須依托專業的智能(néng)化先進(jìn)報警響應管理系統軟件,才能(néng)确保將(jiāng)ISA18.2/IEC62682報警生命周期管理體系中的各項活動納入高質量的PDCA循環,從而持續改善報警系統的各項KPI指标,築牢報警響應這(zhè)第一道(dào)事(shì)故防線。本章對(duì)由北京新數易博信息咨詢有限公司(www.strongpsm.com)開(kāi)發(fā)的SARMS智能(néng)化先進(jìn)報警響應管理系統軟件的主要功能(néng)和應用效果做一下簡單介紹。
需要強調一下,SARMS智能(néng)化先進(jìn)報警響應管理系統軟件的功能(néng)用途和自控系統操作站HMI軟件的報警功能(néng)用途是有顯著區别的,如下圖所示:
SARMS軟件不僅具備對(duì)各種(zhǒng)基于HMI軟件的報警系統進(jìn)行監控、管理和優化的功能(néng),同時也具備HMI軟件的報警信息監控功能(néng),隻是信息終端由控制室的操作站換成(chéng)了生産管理局域網上的PC機和經(jīng)過(guò)授權的手機端,數據大約有秒級的延時(接近實時)。SARMS軟件的組成(chéng)結構如下圖所示:
SARMS軟件的主要功能(néng)如下:
SARMS軟件的數據庫從DCS/PLC/SIS/GDS/FAS系統中自動采集各類信号,包括工藝報警、設備報警、易燃有毒氣體報警、火災報警、手動按鈕報警等。另外,SARMS軟件支持報警的初步設計功能(néng),可在軟件中設置(組态)各種(zhǒng)報警屬性,如報警限值(設定點)、報警信号類型(形式)、死區(滞環)、延遲激活/解除、報警信息(描述、原因/後(hòu)果、響應規程等)。
SARMS軟件的KPI監測評估分析模塊對(duì)各類報警的各項KPI(關鍵性能(néng)指标)進(jìn)行統計分析并與目标基準比對(duì),顯示指标差距,督促分析導緻差距的原因,爲報警合理化結果與設計組态的更新糾正提供依據,以消除滋擾報警,改善性能(néng)。
另外,各類報警信号可按管控級别通過(guò)局域網、手機App或短信自動推送給不同層級的管理人員。SARMS軟件將(jiāng)報警監控功能(néng)由操作站HMI擴展至生産管理網絡上的PC機和相關人員手機端,大大提高了對(duì)安全關鍵報警的監控力度和廣度。領導層可随時随地(包括出差期間和非工作時間)接收掌握報警信息,不僅可及時協助現場進(jìn)行分析和處理,還(hái)可以起(qǐ)到倒逼管理的作用。
SARMS軟件的報警合理化輔助模塊支持從HAZOP軟件CAH和LOPA軟件CAS中導入危險劇情和相關數據,不僅提高報警合理化的工作效率,還(hái)可將(jiāng)數據同步至報警信息監控模塊,利用HAZOP/LOPA分析結果作爲知識庫自動分析并顯示和工藝報警關聯的劇情(原因、後(hòu)果、可容忍響應時間),以便操作人員及時決策和采取響應行動。
對(duì)于安全關鍵報警信号,還(hái)可進(jìn)一步與相應的報警響應規程(報警後(hòu)處置步驟)聯動,同時推送至PC機和手機端,推送方式和内容關聯報警類别和優先級,有助于指揮人員及時決策和行動,有效發(fā)揮“黃金 5分鍾”作用;報警響應規程中提供的信息可支持缺乏經(jīng)驗的初級操作員掌握高級操作員的知識,促進(jìn)響應的一緻性。如果操作站HMI軟件支持,建議組态報警響應規程彈窗功能(néng),并與PC機和手機端的信息同步。
傳統的紙質應急處置卡涵蓋場景不全,一般限于發(fā)生危化品LOPC(失事(shì)點)之後(hòu)的應對(duì)措施 ,針對(duì)性不強,未細化到針對(duì)每個安全關鍵報警一一對(duì)應設置專門的響應規程(應急處置方法步驟)。另外,除非操作人員在腦中熟記,否則查尋應急處置卡費時(尤其是在整本的操作手冊中查找),容易錯失及時阻止危險劇情傳播或事(shì)故擴大的“黃金5分鍾” 窗口期!而SARMS軟件的報警響應規程自動推送功能(néng)可將(jiāng)應急處置的時間關口從LOPC後(hòu)前移至工藝參數剛剛偏離報警時,在不停産的前提下保證了安全。即使對(duì)于在LOPC之後(hòu)需要啓動事(shì)故應急預案的安全關鍵報警(比如火氣報警或SIF拒動報警),SARMS軟件可自動推送事(shì)故應急預案以供管理層核實确認後(hòu)及時下達啓動預案的決策,掌控關鍵的“黃金5分鍾”,避免事(shì)故擴大化!
SARMS軟件支持先進(jìn)報警(增強型報警)設計和組态。比如基于狀态的報警/抑制,這(zhè)種(zhǒng)設計對(duì)抑制報警洪災有顯著作用。首出報警(SOE)是另外一種(zhǒng)常見的先進(jìn)報警設計。
支持CSV文件格式的報警組态文件的導入和導出。
企業可采用SARMS智能(néng)化先進(jìn)報警響應管理系統軟件實現對(duì)全廠所有數字自動化控制系統(DCS/PLC/F&G等)的報警信息彙總和分布式監控,補充和擴展報警響應規程推送功能(néng)。同時對(duì)現役各種(zhǒng)報警系統性能(néng)指标進(jìn)行監測分析以持續改善,典型的項目工作流程如下圖所示:
在上圖所示的活動中,持續的報警KPI性能(néng)監測和報警合理化是ISA18.2/IEC62682報警生命周期管理體系PDCA循環中兩(liǎng)項最關鍵的任務。如本文第二和第三章所述,必須依托專業軟件才能(néng)确保KPI監測的質量和實時性,報警合理化可以采用電子表格工具而以人工方式開(kāi)展分析(基于PH&RA),但用軟件輔助分析有益于提高效率和質量。北京新數易博信息咨詢有限公司研發(fā)的SARMS智能(néng)化先進(jìn)報警和應急響應管理系統軟件不僅具備上述兩(liǎng)項功能(néng),另外還(hái)内置報警信息和響應規程全方位24小時推送(聯網PC端和手機端)功能(néng),同時具備事(shì)故前後(hòu)應急響應調度指揮功能(néng)。北京思創提供和SARMS軟件配套的工程服務,包括實時數據或報警信息采集,基于MADB(報警主數據庫)的報警組态(配置),另外還(hái)爲企業提供SARMS管理系統信息化平台搭建運行所必需的下列相關咨詢服務:
1、指導業主制定體系化的報警導則以及開(kāi)展報警合理化所需的标準工作規程;
2、主持或指導報警合理化分析;
3、幫助業主培養報警合理化分析的專業人才;
4、指導業主開(kāi)展現場應急處置方案的可執行性分析。
當SARMS智能(néng)化先進(jìn)報警響應管理系統軟件信息化平台搭建調試完成(chéng)并上線投運後(hòu),企業還(hái)需要制定配套的相關服務和崗位責任制度,制定工藝參數報警考核細則,加大檢查和考核力度,以考核促工藝報警管理水平的提升,以确保基于ISA18.2/IEC62682标準的綜合管理解決方案真正落地運行。
實踐證明,使用SARMS智能(néng)化先進(jìn)報警響應管理系統綜合解決方案後(hòu)能(néng)顯著提高報警的性能(néng)指标,并有助于提升報警管理的有效性和操作員的響應性能(néng)(正确性和速度),典型的使用效果如下圖所示:
某上市大型氯堿化工集團,原來各生産裝置的報警率都(dōu)很高,因其主要産品PVC的生産屬于典型的間歇式工藝(約8 小時一個批次),在批次之間的開(kāi)停工階段更會産生報警洪災。2021年開(kāi)始逐步實施SARMS智能(néng)化先進(jìn)報警響應管理系統結合報警合理化的綜合解決方案後(hòu),實現了報警數量大幅降低,尤其是采用基于狀态的抑制後(hòu)消除了開(kāi)停工階段的報警洪災,其中,聚合二期DCS報警數量比優化前減少了96.80%。其2021年前半年各生産裝置的報警KPI均逐步改善提升,參見下表:
總結
漠視“安全報警”的風險代價超乎普通人的直覺和想象,國(guó)内外屢屢發(fā)生的工藝(過(guò)程)安全事(shì)故慘痛教訓爲人們一遍遍地敲響警鍾。牧童絕望凄厲的哭喊“大灰狼真來了”在耳邊一次次地回響,試圖喚醒那些可能(néng)仍在麻痹中祈禱賭運氣的危化品企業。
“如何築牢報警響應這(zhè)第一道(dào)事(shì)故防線”是擺在現實面(miàn)前的嚴峻考題,必須通過(guò)體系化的科學(xué)方法才能(néng)從根本上予以解決。
概括而言,體系化的科學(xué)解決方案就是基于ISA18.2/IEC62682标準,建立實施涵蓋報警系統生命周期各階段(識别與合理化、設計、采購和實施、運行維護、性能(néng)監測評估、變更管理、體系審計和改進(jìn))有效的報警管理體系,并配套應用專業的智能(néng)化先進(jìn)報警響應管理系統信息化平台軟件(如北京思創的SARMS),從而爲操作員創造一個能(néng)夠及時正确地感知偵察、診斷并響應報警的良好(hǎo)條件和環境,同時加強對(duì)操作員的報警響應日常培訓和定期演練,以最大程度降低人因失誤概率,确保“報警+人工響應”這(zhè)第一道(dào)事(shì)故防線的安全可靠性,并和後(hòu)續其它保護層的安全措施協作,共同將(jiāng)工藝(過(guò)程)安全事(shì)故風險降低,并維持在法律和企業的可容忍風險目标以下。此外,守牢報警響應這(zhè)第一道(dào)事(shì)故防線,不僅确保了安全,還(hái)能(néng)顯著減少被(bèi)迫緊急停車所導緻的直接和間接生産損失。另外,報警性能(néng)的改善提升有助于提高工藝狀況平穩率、勞動生産率和産品質量,還(hái)可能(néng)有助于降低原料和能(néng)源消耗。