機房應急預案
在學習、工作乃至生活中,有時會遇到無法預料的突發(fā)事故,為了可以及時作出應急響應,降低事故后果,就有必要提前進行細致的應急預案準備工作。那么大家知道應急預案怎么寫才規(guī)范嗎?以下是小編收集整理的機房應急預案,希望能夠幫助到大家。
機房應急預案1
機房建設消防規(guī)范:
機房消防系統(tǒng)要求根據(jù)國內(nèi)外實際經(jīng)驗要求使用七氟丙烷(FM200)氣體滅火系統(tǒng),安裝時各種管道及閥門必須按照國際標準執(zhí)行,投標時要求注明各種附件的規(guī)格,安裝結束后,必需經(jīng)相關消防部門驗收合格。
(1)整體機房應設火災自動報警系統(tǒng),并應符合現(xiàn)行國家標準《火災自動報警系統(tǒng)設計規(guī)范》的規(guī)定。
(2)整體機房必須設置火災報警裝置,報警裝置安裝在值班人員隨時可以發(fā)現(xiàn)的位置。
(3)主機房的消防系統(tǒng)按要求分成三個消防區(qū),即天棚吊頂上方為一區(qū),機房空間為二區(qū)、活動地板下為三區(qū),在每個消防區(qū)內(nèi)應按相關要求設置煙、溫感探測器和滅火氣體。
1、機房建筑規(guī)定:
機房主體結構應具有耐久、抗震、防火、防止不均勻沉陷等性能,變形縫和伸縮縫不應穿過主機房,室內(nèi)頂棚上安裝的燈具、風口、火災探測器及噴嘴等應協(xié)調布置,并應滿足各專業(yè)的技術要求,機房圍護結構的構造和材料應滿足保溫、隔熱、防火等要求。
機房的耐火等級應符合現(xiàn)行國家標準《高層民用建筑設計防火規(guī)范》、《建筑設計防火規(guī)范》及《計算站場地安全要求》的規(guī)定,當機房與其它建筑物合建時,應單獨設防火分區(qū)機房的安全出口,不應少于兩個,并宜設于機房的兩端,門應向疏散方向開啟,走廊、樓梯間應暢通并有明顯的疏散指示標志,主機房、基本工作間及第一類輔助房間的裝飾材料應選用非燃燒材料或難燃燒材料,電子計算機機房內(nèi)的給排水管道應采用難燃燒材料保溫。
2、機房的消防與安全規(guī)定:
機主機房、基本工作間應設二氧化碳或鹵代烷滅火系統(tǒng),并應按現(xiàn)行有關規(guī)范的要求執(zhí)行,機房應設火災自動報警系統(tǒng),并應符合現(xiàn)行國家標準《火災自動報警系統(tǒng)設計規(guī)范》的規(guī)定,報警系統(tǒng)和自動滅火系統(tǒng)應與空調、通風系統(tǒng)聯(lián)鎖。空調系統(tǒng)所采用的電加熱器,應設置無風斷電保護,機房的安全設計,除執(zhí)行本章的規(guī)定外,尚應符合現(xiàn)行國家標準《計算站場地安全要求》的規(guī)定,用于非常重要的場所或發(fā)生災害后造成非常嚴重損失的機房,在工程設計中必須采取相應的技術措施。
3、消防設施與安全措施:
設置二氧化碳或鹵代烷固定滅火系統(tǒng)及火災探測器的機房,其吊頂?shù)纳稀⑾录盎顒拥匕逑拢鶓O置探測器和噴嘴,主機房宜采用感煙探測器,當設有固定滅火系統(tǒng)時,應采用感煙、感溫兩種探測器的組合,當主機房內(nèi)設置空調設備時,應受主機房內(nèi)電源切斷開關的控制,機房內(nèi)的電源切斷開關應靠近工作人員的操作位置或主要出人口,主機房出口應設置向疏散方向開啟且能自動關閉的門。
并應保證在任何情況下都能從機房內(nèi)打開,凡設有鹵代烷滅火裝置的電子計算機機房,應配置專用的空氣呼吸器或氧氣呼吸器,機房內(nèi)存放廢棄物應采用有防火蓋的金屬容器,機房內(nèi)存放記錄介質應采用金屬柜或其它能防火的容器,根據(jù)機房的重要性,可設警衛(wèi)室或保安設施,還有電子計算機機房應有防鼠、防蟲措施。
4、機房管理人員必須做到以下規(guī)范:
加強消防管理,防止火災危害,保護機房、人員的`生命財產(chǎn)安全,機房管理人員要熟悉消防法規(guī)、消防工作管理制度及應急措施,熟悉消防重點部位的布局、建筑特點、防火區(qū)域及疏散通道走向、消防設備的配置情況,熟悉并掌握各類消防設施的使用性能和操作方法,還要對管理范圍內(nèi)的各種消防設施、器材進行檢查,確保設施、器材的完好有效,發(fā)現(xiàn)設備故障時,應及時報告,定期對機房供電線路及照明器具進行檢查,防止因線路老化短路造成火災,嚴禁攜帶易燃、易爆、易碎、易污染、強磁、有毒物品等危險品進入機房,認真巡視檢查,做到人走關窗、斷電、鎖門。
初期火災撲救,必須掌握一定的滅火技能,遇火情時應積極撲救,及時向報告消防安全工作領導小組和消防中心報警,并保護好現(xiàn)場。
機房管理人員必須對消防設施、器材維護管理:
1、消火栓不應被遮擋、圈占、埋壓。
2、機房管理人員對機房消防設施、器材要加強維護保養(yǎng),確保其完好無損。
3、發(fā)現(xiàn)異常情況,遇到有人破壞,要馬上采取措施并報告報告消防安全工作領導小組,不得延誤。
4、滅火器應保持銘牌完整清晰,保險銷和鉛封完好,應避免日光曝曬、強輻射熱等環(huán)境影響,滅火器應放置在不影響疏散、便于取用的指定部位,并擺放穩(wěn)固,不應被挪作它用、埋壓或將滅火器箱鎖閉。
機房消防應急預案措施:
為確保機房安全與穩(wěn)定,以保證正常運行為宗旨,按照“預防為主,積極處置”的原則,本預案適用于機房存在的重大火災隱患和因各種原因發(fā)生的火災事件等。
機房火災預防措施:
1、走廊、樓梯等公共部位嚴禁堆放物品,保持通道暢通。
2、機房全體人員應有高度的防火意識,禁止在機房內(nèi)存放易燃易爆物品,禁止在機房內(nèi)吸煙或使用明火,禁止在機房內(nèi)亂拉電線。
3、消防器材由專人負責保管,定期檢查消防器材。未經(jīng)許可,禁止擅自移動。
4、每月進行一次電源開關、電器和線路的檢查,發(fā)現(xiàn)故障、老化、破損、絕緣不良等不安全因素,必須及時報修,并做好記錄備案,消除安全隱患。
機房火災處置:
1、確認機房設備區(qū)域火情后,根據(jù)現(xiàn)場情況實施機房區(qū)域氣體滅火操作。
2、消防應急指揮小組進入現(xiàn)場,開展滅火救援行動。在消防人員未到達火災現(xiàn)場時,應打開應急通道,組織現(xiàn)場無關人員有序疏散,并派人及時切斷電源,隔離火災危險源和重要設備,充分利用中心消防器材進行滅火。機房發(fā)生火災,應遵照下列原則:首先保人員安全;其次保關鍵設備、關鍵數(shù)據(jù)安全;三是保一般設備安全。
3、協(xié)助消防員滅火。在自救的基礎上,當專業(yè)消防隊到達火災現(xiàn)場后,火災事故應急指揮小組要簡要的向消防隊負責人說明火災情況,聽從消防隊的指揮,并全力支持消防隊員滅火。
4、機房消防與大樓值班室相連接,值班人員發(fā)現(xiàn)報警器報警或發(fā)現(xiàn)火情時,應在迅速確認后電話通知大樓監(jiān)控中心,并根據(jù)火情直接報119火警。
5、電話通知應急指揮小組,啟動應急預案。報告后,應根據(jù)火勢情況,向周圍人員發(fā)出火警信號。
機房火災后處理方案:
1、火災消除后,應將搶運的設備物資放置在安全場所,并登記造冊,計算火災損失。
2、火災消除后,對火災現(xiàn)場進行清理,消除燒毀物資,杜絕火勢復燃。
3、災后值班人員和安全主管人員應配合消防部門和公安部門分析火災原因,明確火災責任人。
機房消防安全應急預案2
為認真貫徹落實《國務院關于特大安全事故行政責任追究的規(guī)定》,積極提高我公司重點要害部位特大安全事故應急處理能力,努力減少各類特大安全事故所造成的損失,消除火災事故的隱患,保障公司財產(chǎn)和員工的生命安全,特制定本預案。
本預案針對我公司通信機房的火災而制定。
移動通信機房滅火流程如下:
(一)值班人員發(fā)現(xiàn)機房火情(包括監(jiān)控中心人員)要立即到現(xiàn)場查看。
(二)如果是個別電路盤著火,應拔出著火的電路盤,用1211或二氧化碳滅火器將火撲滅。
(三)某機柜幾塊電路盤及電纜著火,應立即拔出著火的電路盤,用1211或二氧化碳滅火器噴射滅火劑將火撲滅。
(四)如果機房的機架機柜著火,值班人員無力自滅自救時,監(jiān)控中心應切斷機架機柜電源或樓層電源,關閉空調,嚴禁開窗,及時向公司安全生產(chǎn)管理領導小組報告。
(五)公司安全生產(chǎn)管理領導小組指揮機關義務消防隊隊員進行滅火,組織值班人員立即撤離現(xiàn)場,封閉門窗,按下區(qū)域自動滅火按鈕滅火,同時撥打119報警,大聲呼救,報告公司主管領導或安保值班室,監(jiān)控室廣播火警。
(六)在消防隊到達后,應積極配合,簡明扼要說明著火位置,火勢情況和已采取的補救措施。
(七)用1211或二氧化碳滅火器噴射滅火劑能把火撲滅的,應配合消防隊保護現(xiàn)場和消除隱患,防止再次著火。
(八)用1211或二氧化碳滅火器不能把火撲滅時,為防止煙熏引起人員中毒,應組織人員有序疏散,使用相應的滅火器材滅火,盡快將火撲滅。
(九)應保護好現(xiàn)場,按照事故調查處理辦法執(zhí)行。
(十)火災報警電話:119
本預案應注意的特別事項
1、當發(fā)生火災情況,進行處理并保證人身安全的同時,
根據(jù)設備的重要性進行相應的搶救措施,保證重要設備,特別是直通電話,以及與冀北、華北相應數(shù)據(jù)的上傳,保證通道暢通。
2、搶救完主要設備,在進行次要的設備搶修,待事故處理完畢后,進行相應的實驗,保證設備的運行性,并進行設備的可行性分析。
機房火災消防的應急預案3
第一節(jié)總則
1、保證人員和財產(chǎn)的安全為前提的原則:在由于火災或電力問題造成的主機故障,在解決故障前,應以保證人員的生命安全和財產(chǎn)的安全為前提,然后進行故障的解決。
2、最快時間恢復業(yè)務的原則:本著先想盡一切方法,盡快恢復業(yè)務的原則來處理故障,如在有備用設備的情況下,主設備產(chǎn)生了故障,應先盡快將應用切換到備用機上,使業(yè)務能夠運行,再對故障設備進行診斷和維修。
3、故障應急人員高度負責的原則:當故障應急人員在節(jié)假日接到故障通知時,本著高度負責的態(tài)度,應迅速接手處理障礙,如遠程無法處理解決,應迅速趕到故障設備所在地,進行現(xiàn)場處理,處理故障的同時應及時向領導匯報。應急人員不可互相推卸責任,如因特殊情況,確實無法處理障礙,部門領導必須安排好其他人員處理。
4、盡可能全面的保留故障現(xiàn)場的原則:當故障發(fā)生后,應急人員應盡可能全面的備份出能夠反映故障現(xiàn)象的各種日志、記錄、受損文件等,便于業(yè)務恢復后,對故障的分析、解決,杜絕故障的再次發(fā)生。
應急方案的目標:保證預付卡運營系統(tǒng)連續(xù)安全穩(wěn)定地運行。
第二節(jié)應急領導小組
應急領導小組成員:
組長:副組長:成員:
第三節(jié)電源系統(tǒng)故障應急處理
定期檢查信息中心機房電源設備的運行狀況,當發(fā)生下列突發(fā)事件時,按以下方案進行處置:
當中心機房發(fā)生市電供電突然停電或遠程報警電源異常時。首先確認是否為正常停電及預計停電時間。檢查不間斷電源的電池可供電時間,需在不間斷電源供電時效內(nèi)關閉所有服務器及網(wǎng)絡設備。
聯(lián)系工程部查看停電原因,盡快恢復供電,并將情況報告相關領導
工程部聯(lián)系電話:
第四節(jié)空調系統(tǒng)故障應急處理
定期對空調的運行情況進行檢查,如有報警信息,應及時查找故障原因,對于不能自行排除的問題,應及時與設備提供商進行聯(lián)系。
當中心機房主空調因故障無法制冷,致使機房內(nèi)環(huán)境溫度超過攝氏40度時,打開機房房門,并關閉所有服務器及網(wǎng)絡設備。對于無法自行處置的空調系統(tǒng)異常情況,及時與設備提供商聯(lián)系,并報告公司領導。空調問題聯(lián)系人:
第五節(jié)中心機房自動消防系統(tǒng)應急處理當中心機房發(fā)生火警時,按以下方案進行處置:
1.上班工作時間發(fā)生火警,聽到自動消防系統(tǒng)發(fā)出的聲光報警后,中心機房附近辦公室人員應及時緊急撤離,避免氣體自動消防系統(tǒng)啟動后,消防氣體對附近人員造成人身傷害。確認火警后,立刻撥打119報警,并說明盡量使用氣體滅火器進行滅火,減少電子設備的損壞。
2.發(fā)生火警后,信息中心相關人員應馬上趕赴現(xiàn)場,并向有關領導報告事故情況。同時立即聯(lián)系聯(lián)通等相關公司,及時評估事故損失情況,研討盡快恢復信息系統(tǒng)正常運行的最佳方案。安保消防中控電話:
第六節(jié)設備、網(wǎng)絡系統(tǒng)故障應急處理
設備、網(wǎng)絡應用系統(tǒng)故障應由發(fā)現(xiàn)人通知技術部,技術部門立即檢查故障,進行初步故障定位,解決;
1.網(wǎng)絡設備、服務器、儲存設備均有備份,當設備存在硬件問題時,可隨時把業(yè)務切換到備份主機上,保證業(yè)務正常運行;2.應用系統(tǒng)每更新一次則做一次遠程備份,在遠程主機上分別備份舊的應用系統(tǒng)和更新后的應用系統(tǒng),以當天的更新日期命名;3.對磁盤柜上的數(shù)據(jù)庫文件有定時任務,每天凌晨4:00會把數(shù)據(jù)庫里的數(shù)據(jù)文件倒出到遠程備份主機上,以確保磁盤柜出現(xiàn)硬件故障的時候,數(shù)據(jù)文件不丟失;對于網(wǎng)絡、應用系統(tǒng)出現(xiàn)硬件方面的故障,比較嚴重的問題,對業(yè)務的正常運行造成較大的影響,立即向有關領導報告。
4、網(wǎng)絡中有監(jiān)控服務器,運用Cactiv10最新的版本,監(jiān)控網(wǎng)絡所有設備(路由器,防火墻,交換機以及服務器設備);對設備本身的硬件檢測、外部入侵檢測、外部攻擊等多種對系統(tǒng)不利因素以發(fā)送mail的形式報警;相關人員收到報警信息,分析收到的log日志以做出相應的處理。
5、每周周五對網(wǎng)絡設備進行日志及配置文件采集,對數(shù)據(jù)庫數(shù)據(jù)文件定期下載,和遠程備份;在本地電腦上保存最近的配置文件,以便在發(fā)生毀滅性的災難時,用來重組。
對簡單故障,運維人員應迅速排除故障,解決問題并記錄。如果需要更換設備,應上報有關領導,經(jīng)批準后馬上更換故障設備,盡快恢復網(wǎng)絡、應用系統(tǒng)運行。運維部門判斷無法及時修理時,應立即通知相關的系統(tǒng)運行服務提供商,在最短的時間內(nèi)安排修理或更換系統(tǒng)。
如發(fā)現(xiàn)屬外部線路的問題,應與線路服務提供商聯(lián)系,敦促對方盡快恢復故障線路。
啟用備份線路、設備、系統(tǒng),迅速恢復相關的應用。
聯(lián)通聯(lián)系電話:
第七節(jié)黑客入侵的應急處理
發(fā)現(xiàn)網(wǎng)絡上有黑客攻擊行為,任何人員都有義務向技術部門報告。技術部立即啟動應急響應,切斷受攻擊計算機與網(wǎng)絡的連接,停止一切操作、保護現(xiàn)場,并上報有關領導。
對于黑客攻擊,由計算中心組織應急響應專家小組查找入侵蹤跡,分析入侵方式和原因。由安全管理員根據(jù)對入侵事件的分析,組織相關人員對內(nèi)部網(wǎng)計算機整改,防止黑客用同樣的手段再次入侵其他系統(tǒng)。安全管理員檢查確定無安全隱患后,才可將受攻擊計算機重新連接網(wǎng)絡,或啟用備份計算機來恢復應用。
安全管理員應做好記錄,保護現(xiàn)場,進行日志收集等工作。如果能追查到攻擊者的相關信息,可以對其發(fā)出警告,必要時可以采取進一步的行動,乃至采取法律手段。根據(jù)破壞程度,經(jīng)有關領導同意后,上報公安部門。
若系統(tǒng)已被黑客破壞,無法恢復,應將受黑客攻擊的計算機上的重要數(shù)據(jù)備份到其他存儲介質,確保計算機內(nèi)重要的數(shù)據(jù)不丟失。如果數(shù)據(jù)無法恢復,經(jīng)有關領導同意后,可與國家指定的部門聯(lián)系,由他們來協(xié)助恢復,為保證數(shù)據(jù)信息安全,需在安全管理部門作記錄。
第八節(jié)生產(chǎn)系統(tǒng)、數(shù)據(jù)庫故障處理
生產(chǎn)系統(tǒng)出現(xiàn)故障,技術部做出應急處理
1.因軟件設計缺陷、設計漏洞等引起的故障,通知公司研發(fā)部門在2小時內(nèi)查明原因,解決問題。
2.數(shù)據(jù)庫出現(xiàn)故障,運維人員應在2小時內(nèi)查清故障原因,其他相關部門應積極配合,解決問題。
3.如出現(xiàn)數(shù)據(jù)丟失情況,確認不能自行恢復后,啟用備份恢復數(shù)據(jù),24小時內(nèi)恢復運營。
本方案自發(fā)布之日起施行
機房應急預案2
機房消防應急預案
為使信息機房發(fā)生火災事故時,當班人員能鎮(zhèn)靜有序地處置事件,特制訂本預案,請各成員認真學習,熟悉應急處置程序,提高全員的應急能力,一旦發(fā)生突發(fā)事件,盡最大努力保證員工人身安全和減少損失。
起火原因一般有明火管理不慎;電氣設備管理、使用不當;縱火等原因。
預案一:當聞到燒焦氣味時
當班人員發(fā)現(xiàn)信息機房內(nèi)有冒煙現(xiàn)象或聞到燒焦氣味時,可能是某處陰燃處于起火階段或電源超負荷發(fā)熱引起,容易引發(fā)火災,當班人員要立即查明原因和地點,針對不同情況,采取迅速將火源撲滅或關閉電源總開關、隔離火源附近易燃物、關閉窗等措施,消除起火隱患,防止引了火災。事后立即向安保部門報告,并做好現(xiàn)場保護工作和防止起火點復燃,不得隨意離開現(xiàn)場和將事故隱瞞不報。預案二:當班時發(fā)現(xiàn)起火或冒出濃煙
由于起火源隱蔽或其他突發(fā)原因未能及時發(fā)現(xiàn)和消除起火隱患,釀成明火和冒出濃煙,燃燒面積不大,就是火災的初起階段,當班人員發(fā)現(xiàn)起火或冒出濃煙時,切忌驚惶失措,要沉著、果斷,會同其他當班人員分工協(xié)作,迅速查明原因組織撲救,當火執(zhí)已無法控制時處置辦法:
一是指定專人立即拔打“119”火警電話報警和向上級保衛(wèi)部門報告,并向本部門和周圍的人及群眾喊叫報警;二是組織本單位、部門在場的人員有序地投入撲救工作,充分利用消防栓、滅火器、水桶等器材滅火,不能消極等待消防隊到來,而錯過滅火良機,力求將火撲滅或控制火勢蔓延,不能只顧個人安危而逃離火場
三是大聲呼喊請求鄰近單位及群眾的支援。
四是在組織滅火同時,要立即組織人員疏散和轉移物品中,特別昌易燃、易爆物品和易受到火舌威脅的現(xiàn)金、重要憑證要及時轉移到安全地點,并派人員守護,確保安全。
五是滅火后要注意保護現(xiàn)場,維護好秩序,以利于消防部門調查分析火災原因。注意事項:
報警人員報警時要向消防部門講清楚起火地點、單位、起火的種類和火勢大小,報警后即到街道或十字路口迎接、引導消防車輛的'到來;撲救人員在消防人員到來后,要立即向消防指揮人員講清火場內(nèi)存放有何種物資和貴重物品,火場內(nèi)是否有爆炸、劇毒物品,并協(xié)助消防部門維護好現(xiàn)場秩序。自行撲救火災時要留心觀察火勢和環(huán)境,防止被火圍困、煙氣中毒、墜物砸傷等,在確保自身安全的情況下?lián)渚然馂摹?/p>
機房應急預案3
機房消防安全工作極為重要,一旦發(fā)生火災,將直接影響大廈內(nèi)設備正常運行,并對人身安全和經(jīng)濟財產(chǎn)造成巨大的損失。為防范消防安全事故發(fā)生,保證消防安全事故發(fā)生時能夠快速、高效、合理有序地處置,特制定本預案。
一、電氣火災的主要因素
1、電氣線路短路、過載、接地電阻過大等引發(fā)火災。
2、由于機房內(nèi)設備長時間不間斷運行或設備故障引發(fā)火災。
3、靜電產(chǎn)生火災。
4、雷電等強電入侵引發(fā)火災。
二、處置程序
1、發(fā)現(xiàn)火情后,迅速切斷電源,利用就近滅火器進行滅火,并按照特級事故通報機制進行通報,向領導匯報火災具體情況。
2、迅速組織相關人員攜帶消防器具趕赴現(xiàn)場滅火,并聽從現(xiàn)場指揮人員指揮。
3、如火情較為嚴重,應立即與大廈消防中控取得聯(lián)系,并與之協(xié)商處理辦法措施,必要時需要專業(yè)消防滅火的,迅速請示領導撥打119。
三、注意事項
1、一旦機房發(fā)生火災,應遵循以下原則:首先保證人員安全;其次保證關鍵設備安全;再保證一般設備安全;救火過程中應邊救火,邊報警。
2、火災發(fā)生時,第一發(fā)現(xiàn)人查明起火原因,如因電源引起,應首先切斷電源。
四、預防措施
1、對機房內(nèi)電氣設備定期檢查。發(fā)現(xiàn)存在問題的'設備及時維修,消除安全隱患。
2、每天定時對機房重要電氣設備和電子設備的溫度進行了監(jiān)控,能夠及時地發(fā)現(xiàn)并消除隱患。
3、應組織相關人員進行消防安全教育,學習消防知識,學會正確使用各種滅火器,有計劃的進行相關的消防演習。
機房應急預案4
為確保辦公室機房安全與穩(wěn)定,以保證正常運行為宗旨,按照“預防為主,積極處置”的原則,本著建立一個有效處置突發(fā)事件,建立統(tǒng)一指揮、職責明確運轉有序、反應迅速處置有力的機房安全體系的目標,特制定本預案。
一、機房日常維護
1、建立健全機房管理制度
(1)在正常工作日內(nèi),信息技術人員負責對機房進行監(jiān)控,主要職責是:巡視網(wǎng)絡設備及系統(tǒng)的運行情況,發(fā)生異常情況及時處理,消除網(wǎng)絡故障隱患。
(2)節(jié)假日期間信息技術人員輪流值班,負責處理有關異常情況。
(3)機房采取來人來訪登記制度,未經(jīng)允許,無關人員不得進入機房區(qū)域。
2、機房內(nèi)嚴格采取防雷、防火、防塵、防靜電等措施以及機房入口處24小時監(jiān)控錄像等措施。
3、認真做好數(shù)據(jù)備份工作,定期做一次數(shù)據(jù)庫完全備份,每月檢查服務器運行和備份情況。
4、信息技術人員對機房的主要網(wǎng)絡設備(路由器、主干交換機等)進行工作時間內(nèi)全程監(jiān)控,發(fā)現(xiàn)異常情況應及時進行處理,確保辦公室網(wǎng)絡的正常運行。
二、機房突發(fā)事件應急處置方案
1、電源系統(tǒng)應急預案
(1)定期檢查機房供電設備的運行狀況和電路線纜器材情況,當發(fā)生下列突發(fā)事件時,按照以下方案進行處置:
(2)當機房發(fā)生市電供電突然停電或是電源異常時。檢查不間斷電源的電池可供電時間,確保設備正常運行,如遇到突然斷電,應及時將空調等設備及時斷電,預防突然來電時瞬間電流過大導致設備損壞等現(xiàn)象。
(3)當確定停電原因是在本身供電系統(tǒng)范圍內(nèi),立即匯報給負責領導,并及時聯(lián)系相關維護人員達到現(xiàn)場檢修。
(4)恢復供電后,嚴格按照操作程序逐步恢復機房設備,以防瞬間電流過大造成設備損壞。
2、網(wǎng)絡和服務器絡系統(tǒng)應急預案
(1)發(fā)生網(wǎng)絡故障時,首先檢查機房設備情況,確定網(wǎng)絡故障的原因,然后聯(lián)系網(wǎng)絡維護人員,及時處理和排除故障。
(2)當確認原因為短時間無法恢復,應該及時向負責領導匯報,然后再聯(lián)系維護人員,及時處理故障。
(3)當人為或病毒破壞的故障發(fā)生時,具體按以下順序進行:判斷破壞的'來源及性質,斷開影響安全與穩(wěn)定的信息網(wǎng)絡設備,斷開與破壞來源的物理網(wǎng)絡連接,然后再聯(lián)系維護人員,及時處理故障。
(4)發(fā)生服務器系統(tǒng)故障后,應立即向相關領導匯報情況,同時安排人員將故障服務器脫離網(wǎng)絡,保存系統(tǒng)狀態(tài)不變,保護原始數(shù)據(jù)。
在確認安全的情況下,重新啟動故障服務系統(tǒng):若重啟系統(tǒng)成功,則檢查數(shù)據(jù)丟失情況,利用備份數(shù)據(jù)恢復;若重啟失敗,立即 聯(lián)系相關維護人員,請求技術支持,做好技術處理。
處置結束后,技術人員應將處理過程記錄下來,以方便日后對此問題的處理。
3、消防和防雷應急預案
(1)上班工作時間發(fā)生火警,還在機房工作的人員應及時緊急撤離,并立刻撥打119報警。在確保自身安全的情況下,應盡量使用滅火器進行滅火,減少電子設備的損壞。同時采取關閉電源總閘等措施,盡量減少可能造成的損失和破壞。
(2)非工作時間或節(jié)假日休息時間值班人員發(fā)現(xiàn)火情后,要立刻撥打119報警,并立刻通知相關部門和領導,做好火災的處置工作。
(3)火情結束之后,機房相關人員應全體趕赴現(xiàn)場,同時立即聯(lián)系相關網(wǎng)絡公司和設備相關廠家,及時評估事故損失情況,研討恢復網(wǎng)絡系統(tǒng)正常運行的最佳解決方案。
(4)遇雷暴天氣或接上級部門雷暴氣象預警,應關閉所有服務器,切斷電源,暫停內(nèi)部計算機網(wǎng)絡工作。雷暴天氣結束后,及時開通服務器,恢復內(nèi)部計算機網(wǎng)絡工作。因雷擊造成的損失,應及時進行核實、報損,并將詳細情況向部門領導匯報。
4、自然災害和盜搶應急預案
(1)發(fā)生自然災害后,首先應該組織人員撤離現(xiàn)場。當確認災害不會造成人生傷害后,在回到機房檢查設備,立刻向上級領導匯報,并聯(lián)系相關網(wǎng)絡和設備廠家,積極做好災后恢復工作,確保在最短時間內(nèi)
恢復機房正常運行。
(2)發(fā)生盜搶事件后,要保護好現(xiàn)場然后報警,并向上級領導匯報情況。待現(xiàn)場處理完畢后,要組織相關人員估計損毀情況,并聯(lián)系相關網(wǎng)絡和設備廠家,積極做好恢復工作。
機房應急預案5
一、為認真貫徹落實《國務院關于特大安全事故行政責任追究的規(guī)定》,積極提高我公司重點要害部位特大安全事故應急處理能力,努力減少各類特大安全事故所造成的損失,消除火災事故的隱患,保障公司財產(chǎn)和員工的生命安全,特制定本預案。
二、本預案針對我公司通信機房的火災而制定。
移動通信機房滅火流程如下:
(一)值班人員發(fā)現(xiàn)機房火情(包括監(jiān)控中心人員)要立即到現(xiàn)場查看。
(二)如果是個別電路盤著火,應拔出著火的電路盤,用1211或二氧化碳滅火器將火撲滅。
(三)某機柜幾塊電路盤及電纜著火,應立即拔出著火的電路盤,用1211或二氧化碳滅火器噴射滅火劑將火撲滅。
(四)如果機房的'機架機柜著火,值班人員無力自滅自救時,監(jiān)控中心應切斷機架機柜電源或樓層電源,關閉空調,嚴禁開窗,及時向公司安全生產(chǎn)管理領導小組報告。
(五)公司安全生產(chǎn)管理領導小組指揮機關義務消防隊隊員進行滅火,組織值班人員立即撤離現(xiàn)場,封閉門窗,按下區(qū)域自動滅火按鈕滅火,同時撥打119報警,大聲呼救,報告公司主管領導或安保值班室,監(jiān)控室廣播火警。
(六)在消防隊到達后,應積極配合,簡明扼要說明著
火位置,火勢情況和已采取的補救措施。
(七)用1211或二氧化碳滅火器噴射滅火劑能把火撲滅的,應配合消防隊保護現(xiàn)場和消除隱患,防止再次著火。
(八)用1211或二氧化碳滅火器不能把火撲滅時,為防止煙熏引起人員中毒,應組織人員有序疏散,使用相應的滅火器材滅火,盡快將火撲滅。
(九)應保護好現(xiàn)場,按照事故調查處理辦法執(zhí)行。
(十)火災報警電話: 119
三、本預案應注意的特別事項
1、當發(fā)生火災情況,進行處理并保證人身安全的同時, 根據(jù)設備的重要性進行相應的搶救措施,保證重要設備,特別是直通電話,以及與冀北、華北相應數(shù)據(jù)的上傳,保證通道暢通。
2、搶救完主要設備,在進行次要的設備搶修,待事故處理完畢后,進行相應的實驗,保證設備的運行性,并進行設備的可行性分析。
機房應急預案6
第一條 機房突發(fā)事件包括網(wǎng)絡設備或服務器故障、自然災害(水、火、電等)造成的物理破壞、人為失誤造成的安全事件等等。 針對突發(fā)事件的預防措施如下: 建立安全、可靠、穩(wěn)定運行的機房環(huán)境,防火、防盜、防雷電、防水、防靜電、防塵;建立備份電源系統(tǒng);加強防火、防盜意識。
第二條 機房漏水應急預案如下:
一、發(fā)生機房漏水時,第一目擊者應立即通知機房管理人員。
二、若空調系統(tǒng)出現(xiàn)滲漏水,機房管理人員應立即安排停用故障空調,清除機房積水,并及時聯(lián)系設備供應方處理,必要情況下可臨時用電扇對服務器進行降溫。
三、若為墻體或窗戶滲漏水,機房管理人員應立即采取有效措施確保機房安全,同時安排通知工程人員及時清除積水,維修墻體或窗戶,消除滲漏水隱患。
第三條 機房火災應急預案如下:
一、完善機房環(huán)境,確保機房放置滅火器;禁止攜帶易燃易爆物品進入機房。
二、機房管理人員應熟悉機房內(nèi)部消防安全操作和規(guī)則,了解消防設備操作原理,掌握消防應急處理步驟、措施和要領,懂得滅火的方法,會撲救初起火源。
三、一旦發(fā)生火災,迅速切斷機房電源,避免災情的`擴散,并迅速和保安部聯(lián)系必要時立即報火警。
第四條 機房停電應急預案如下:
一、接到停電通知后,應及時通過辦公系統(tǒng)、電話等發(fā)布相關信息,部署應對具體措施,要求在停電前停止業(yè)務、保存數(shù)據(jù)。
二、機房管理人員每日檢查UPS電源的狀態(tài),確保在突發(fā)停電時,UPS電源能自動供應服務器正常工作15分鐘以上,保證員工工作的數(shù)據(jù)及時保存。
第五條 通信網(wǎng)絡故障應急預案如下:
一、發(fā)生通信線路中斷、流量異常等故障后,發(fā)現(xiàn)狀況的員工或部門領導應及時通知網(wǎng)絡管理員。 二、網(wǎng)絡管理員了解情況后,迅速組織檢測故障區(qū)域,并作相關故障處理,逐步恢復故障區(qū)與服務器的網(wǎng)絡聯(lián)接,恢復通信網(wǎng)絡,保證正常運轉。
第六條 服務器故障應急預案如下:
一、機房管理人員每日檢查機房內(nèi)各服務器狀態(tài)。
二、定期備份數(shù)據(jù)服務器數(shù)據(jù)。并將備份資料拷貝到移動設備。服務器出現(xiàn)嚴重硬件故障時啟用備用服務器以保障正常運轉。
機房應急預案7
計算機機房作為所有業(yè)務、應用系統(tǒng)的核心,一旦計算機機房發(fā)生突發(fā)事件,將對單位的數(shù)據(jù)等造成嚴重損失。為此,特制訂機房突發(fā)事件應急預案。
一、機房突發(fā)事件定義
機房突發(fā)事件是指由特殊原因引發(fā)威脅機房安全并且不能通過日常維護手段解決的事件。比如,火災、漏電、斷電等非人為或者人為的事件,重大突發(fā)事件發(fā)生后,應立即組織現(xiàn)場救護或臨時處置,控制事態(tài)發(fā)展,最大限度地減少損失和影響。
二、機構和職責
機房突發(fā)事件應急小組單位領導:
機房突發(fā)事件應急小組部門領導:
機房突發(fā)事件應急小組成員:
各責任人職責:
應急小組單位領導:負責單位層面及范圍內(nèi)的決策與領導。
應急小組部門領導:負責部門層面及范圍內(nèi)的決策與領導并組織實施突發(fā)事件預案。
應急小組成員:按崗位職責分工,聽從指揮,服從安排全力以赴解決突發(fā)事件。
三、突發(fā)事件報警
應區(qū)分原因在第一時間報警。
自然災害(火災),撥打火警電話:119人為事件(非法盜取、攻擊等)撥打匪警電話:110人員傷亡,撥打急救電話:120其他時間(斷電等),撥打值班電話:
四、突發(fā)事件處理
突發(fā)事件發(fā)生后,應立即啟動應急預案。
1、失火、漏水:
視事件的緊急程度,應急小組成員要在領導的指揮下,有組織、有順序的備份數(shù)據(jù)、關閉服務器的電源;組織人力轉移設備。如果自動設備未能正常啟動,應在組長安排下首先切斷機房的水、電路,組織人力采用滅火器等滅火設備人工滅火,同時要在第一時間報警。
2、斷電:
在城電斷電的情況下,機房的.備用電力將發(fā)揮作用,電力供應最長可持續(xù)4小時。由于機房空調沒有備用電力,如確認是供電局斷電,應立即聯(lián)系發(fā)電機發(fā)電;如果不是供電局斷電,而是由于辦公樓電力線路故障引起的斷電,應立即通知電工查找原因,盡快排出故障。如果無法盡快恢復供電,在電力延續(xù)期間,應盡快結束未執(zhí)行完畢的任務,如無法完成需及時備份數(shù)據(jù),同時應關閉所有非必須服務器,盡量不讓機房溫度過高,保證網(wǎng)絡設備的正常運行,以便保障集中在單位的應用系統(tǒng)能正常使用。
五、恢復生產(chǎn)
突發(fā)事件結束后,有關人員應首先對現(xiàn)場進行清理,匯總損失情況并上報各級領導。緊急召開專項會議分析損失情況,制定數(shù)據(jù)恢復計劃。設備損失的要及時更換設備,保證恢復計劃的順利進行。
恢復生產(chǎn)后,系統(tǒng)管理員應對各系統(tǒng)進行自查,上報書面報告,并由部門領導匯總后上報單位領導。
機房管理員在恢復生產(chǎn)后要及時檢查各項維持系統(tǒng),如UPS、滅火器、漏水、漏電探測器等是否正常運行,應及時更換受損的元器件,補充滅火器的填充物。
機房應急預案8
高性能計算技術及應用水平已成為顯示綜合國力的一種標志。高性能計算機持續(xù)不間斷地為用戶提供高性能計算服務,而運維應急預案是主機運行中處理突發(fā)事件的依據(jù)和方法,是主機系統(tǒng)穩(wěn)定運行的保障。本文簡要介紹上海超級計算中心主機運維應急預案,供同行參考。
1.主機和運維管理制度簡介
超級計算機是功能最強、運算速度最快、存儲容量最大的一類計算機。目前只有少數(shù)國家掌握研發(fā)技術,系統(tǒng)造價非常昂貴,多用于國家高科技領域和尖端技術研究,是國家科技發(fā)展水平和綜合國力的重要標志。上海超級計算中心作為上海信息港主體工程之一,國家和上海市政府投資先后引進神威-I超級計算機、神威-64P集群計算機、曙光4000A超級計算機系統(tǒng)并投入商業(yè)化運行。
上海超級計算中心自20xx年正式開通至今,這些高性能計算機系統(tǒng)已安全、穩(wěn)定運行七年多時間,上機用戶取得了豐碩的科研成果和社會效益。在這七年中,為保障這些高性能計算機系統(tǒng)安全、穩(wěn)定、不間斷地運行,技術支持部在中心引進第一臺高性能計算機--神威-I超級計算機系統(tǒng)的同時,建立了機房應急預案、運行記錄、設備運行參數(shù)等基礎運維制度,在二期引進曙光4000A超級計算機系統(tǒng)過程中,不斷完善原有運維制度,并針對該主機系統(tǒng)特點編寫了大量操作方法和應急預案。
中心自20xx年獲得ISO27001(BS7799)信息安全認證以來,技術支持部根據(jù)其要求規(guī)范了文檔體系建設,形成了機房管理制度、應急預案、操作方法、運行情況記錄的四大類運維文檔。
正是這些運維管理制度的不斷完善和有效執(zhí)行,才確保了資產(chǎn)價值高、服務對象廣、社會影響大的中心主機系統(tǒng)安全、穩(wěn)定運行,保障重點項目、用戶服務的連續(xù)性。
2.應急預案重要性
上海超級計算中心機房運維管理文檔劃分為機房管理制度、應急預案、操作方法、運行記錄共四大類(如圖1所示)。
圖1應急預案分類
應急預案在應急系統(tǒng)中起著關鍵作用,它明確了在突發(fā)緊急情況發(fā)生之前、發(fā)生過程中以及剛剛結束之后,誰負責做什么、何時做,以及相應的策略和資源準備等。它是針對可能發(fā)生的重大事故,按照其影響和后果嚴重程度,在應急準備、響應、操作各個方面預先做出的詳細安排,是開展及時、有序和有效事故應急工作的行動指南。因此,應急預案在這四類運維管理文檔中處于最為重要的地位。
3.應急預案分類
應急預案按重要性和事件種類,可以劃分為消防預案、斷電預案、空調預案、其他預案共4種,預案各文檔之間彼此獨立又互為關聯(lián),具有非常強的可操作性。制定預案的指導原則是盡一切可能,最大限度地確保向用戶提供的服務不中斷。在緊急事件發(fā)生的情況下,保證核心設備連續(xù)運行,避免存儲數(shù)據(jù)丟失。在事件處置完成后,能快速恢復高性能計算服務。
3.1消防預案
消防預案是主機房最重要的應急預案。該類預案根據(jù)《上海超級計算中心滅火和應急疏散預案》的原則并結合主機房主機設備和消防設備的運行特性而制定。主要由《主機房消防應急預案》和《主機房氣體噴淋消防系統(tǒng)啟動撤離及處置應急預案》2個文檔組成。
消防應急預案:該預案著重規(guī)范了火警事件發(fā)生后,所有主機維護人員如何根據(jù)所屬區(qū)域和現(xiàn)場情況,判斷和選擇正確的處理方法,同時配合中心物業(yè)人員處置,降低事件帶來的影響。
對于設備發(fā)生煙霧,主機維護人員協(xié)同物業(yè)人員尋找煙霧點予以切斷相關區(qū)域電源;當設備發(fā)生可以控制火情,協(xié)同物業(yè)人員滅火;當主機房發(fā)生火災而無法控制,應采取施救方法等措施。
氣體噴淋預案:該預案描述主機房氣體噴淋系統(tǒng)啟動的響應和確認并具體規(guī)定了撤離機房路線、善后處置。
這兩個預案中,消防應急預案作為消防預案的主體,涉及到如何處理與消防有關情況的各個方面。氣體噴淋預案是主機房發(fā)生重大火災時應對的最終滅火手段和人員撤離引導方法。
3.2斷電預案
斷電預案的重要性僅次于消防預案。該類預案根據(jù)中心供配電系統(tǒng)實際情況和各種斷電影響范圍下對主機運行的最小保障要求而制定的。主要由《主機房斷電應急預案》、《曙光4000A超級計算機系統(tǒng)緊急關機操作方法》、《曙光4000A超級計算機系統(tǒng)雙路斷電關機操作方法》等多個文檔組成主機房斷電應急預案:該預案用于斷電情況下,主機維護人員如何與中心物業(yè)部門聯(lián)系控制主機房供電情況,并且負責對主機系統(tǒng)運行受斷電影響程度做出正確判斷。指導維護人員按影響程度,分別選用預案中對應的操作方法。本預案在所有斷電預案中起指導思想作用。緊急關機操作方法:該預案制定了主機系統(tǒng)在緊急情況下,最快速度關機的操作步驟。主要用于發(fā)生煙霧、明火或消防、斷電預案需在數(shù)分鐘內(nèi)關機斷電的事件。
雙路斷電關機操作方法:該緊急操作預案主要用于在外界雙路供電全部中斷情況下的操作。
該預案的關機原則是:根據(jù)實際電力供應考慮操作步驟,寧慢勿快,在時間允許的情況下,最大程度保證存儲節(jié)點、SAN和SCSI存儲設備、工程用戶的計算節(jié)點的運行,盡可能減少關閉范圍,以確保能在恢復供電的情況下,主機盡快恢復正常運行狀態(tài),減少影響范圍。
3.3空調預案
超級計算機系統(tǒng)在運行中消耗大量電能,在
提供高性能的計算能力同時產(chǎn)生大量的熱量,必須采用專用空調系統(tǒng),以保持主機系統(tǒng)適當?shù)臏亍穸取⒖諝鉂崈舳鹊冗\行環(huán)境需求。因此,專用空調系統(tǒng)與主機系統(tǒng)密切相關,空調預案是主機房必備的`應急預案。
制定該預案的原因在于,斷電情況下,空調與主機系統(tǒng)存在互相牽制的現(xiàn)狀。主機和空調系統(tǒng)均為外界雙路供電,主機系統(tǒng)配有UPS不間斷電源系統(tǒng),而空調系統(tǒng)無UPS支持。在雙路停電情況下,主機系統(tǒng)可獲得UPS電池組支持運行若干分鐘,空調系統(tǒng)無UPS支持只能停機。由于在無空調冷卻情況下,主機系統(tǒng)會在短時間內(nèi)積聚大量熱量導致超過運行警戒溫度,主機系統(tǒng)在有可供電余量的情況下,仍將被迫關機。因此,確保空調中斷情況下的主機運行環(huán)境是該預案的制定原則。
預案根據(jù)各臺主機配備的空調系統(tǒng)特點制定,由《曙光機房空調系統(tǒng)故障應急預案》和《神威機房空調系統(tǒng)應急預案》2個文檔組成,這里僅介紹曙光機房空調系統(tǒng)應急預案。
該預案的第一步:考慮增強主機系統(tǒng)散熱效果,采用打開主機機柜前后門,和機房周邊木門,在通風道上布置有UPS支持的應急風扇,形成空氣對流,帶走熱空氣,從而增強主機系統(tǒng)散熱效果,降低升溫速度。
該預案的第二步:在采取上述措施并持續(xù)升溫到一定溫度之上的情況下,考慮緊急關閉部分或全部計算節(jié)點,減少熱量生成,確保主機系統(tǒng)的核心存儲和網(wǎng)絡系統(tǒng)不受影響,確保空調系統(tǒng)修復后,主機系統(tǒng)能快速恢復運行。
3.4其他預案
除了固定的三類預案之外,技術支持部還根據(jù)主機系統(tǒng)實際運行中出現(xiàn)的各種意外情況,隨時制定具有針對性的預案。
如《大樓頂棚坍塌應急操作方法》的制定,就
是由于20xx年1月連續(xù)發(fā)生雨雪等災害性天氣,中心大樓頂棚大量積雪且難融化,物業(yè)預計存在情況繼續(xù)惡化,有發(fā)生頂棚坍塌事故的可能,一旦發(fā)生將影響一樓主機運行。
針對該突發(fā)的隱患,中心技術支持部制定應急操作方法,對維護巡查頻度范圍、漏水可能發(fā)生位置、如何處理受漏水影響的主機設備等操作步驟進行嚴格界定。即使在最后,中心大樓頂棚經(jīng)受住災害性天氣的考驗,該預案并未發(fā)揮作用,這正體現(xiàn)了應急預案的備而不用的特點。而且通過各種意外
情況的迅速分析、應對和實踐操練,不斷鍛煉主機維護隊伍,使之走向成熟。
4.在實際案例中,應急預案的作用
在主機系統(tǒng)年復一年的運行中,我們希望這些設備正常穩(wěn)定運行,應急預案永遠不會被使用,然而在實際運行中,總免不了因突發(fā)事件執(zhí)行應急預案。
而每次突發(fā)事件是檢驗應急預案制定是否科學、有效的最好證明。
4.1雙路斷電,UPS正常運行案例
20xx年8月某天,因打雷導致供電一路跳閘自動換至另一路供電,曙光機房2臺空調掉電。
主機維護人員立即按應急預案操作,電話通知物業(yè)人員恢復空調運行,恢復過程中所有空調相繼出現(xiàn)高溫報警,機柜液晶屏平均溫度35度,開啟全部曙光機柜前后門,打開神威-曙光玻璃門并調集應急電扇,于12:45恢復正常。
12:50再次出現(xiàn)雙路供電中斷,曙光空調因無
UPS支撐全部斷電,啟動斷電應急預案,開啟
5、6號木門,開啟神威機房全部空調,布置電扇,將冷氣導入曙光機房,熱量從6號木門的外部通道排出,選擇性殺除部分作業(yè),至13:05供電恢復,曙光空調開始工作,13:20環(huán)境恢復正常。全機在此過程中,正常運行未停機,只損失了部分不重要的作業(yè)。
4.2單路斷電,UPS失效案例
20xx年8月某天,因低壓配電柜開關至UPS房間X-JM柜電纜發(fā)生相對地短路,造成UPS機組逆變器自身保護動作,關閉UPS機組,導致曙光主機系統(tǒng)失電。
全機掉電后,主機維護人員迅速按應急預案
手工關閉所有電源開關。10:30恢復供電,溫濕度恢復正常后,全機加電,恢復過程中修復
storage00
1、00
5、010三個盤陣的9個用戶文件系統(tǒng),修復15個節(jié)點加電故障,除cnode00
9、anode029電源
環(huán)境模塊故障,于當日15:10全機系統(tǒng)恢復正常。
由于處置及時,主機受影響范圍很小,在恢復供電后數(shù)小時即成功開啟全系統(tǒng)。
5.隨時保持應急預案的適用性
主機長年累月的運行,故障和問題的發(fā)生,往往是必然的,也是客觀、無法回避的。因此,要求在維護工作中,預先考慮到可能的問題和故障,制定完善的應急預案。應急預案不可能包含所有的故障和問題,但應根據(jù)維護經(jīng)驗,盡可能地設想各種危機情況下的處置措施。做到預想到各種可能的問題。
而在形成應急預案后,更重要的是持續(xù)地在
運行中加以完善、測試和演練,盡可能模擬實際情況,做到即使只有1名維護人員在場,也能在真正發(fā)生危機時,以最短時間獨立處置故障。
以目前中心的主機運維工作為例,三年內(nèi),僅斷電預案就已根據(jù)實際運行情況的變化,制定并更新了5~6個版本,針對夏季突發(fā)斷電也有專用預案。這樣的措施,直接保障了20xx年8月突發(fā)斷電事件中的主機連續(xù)運行。而20xx年8月的突發(fā)斷電事件中,由于預案在之前剛根據(jù)實際情況進行過演練和修改,主機維護人員僅用半小時就完成所有應急操作動作,整機僅有個別設備故障,確保了主機設備未因突發(fā)斷電而發(fā)生大范圍損壞現(xiàn)象,恢復供電后直接完成開機。
實踐證明,完善而適用的應急預案能保障向用戶提供穩(wěn)定的高性能計算服務。
6.結束語
完備而適用的應急預案能有效降低主機系統(tǒng)因意外事件發(fā)生帶來的運行風險,對可能發(fā)生的意外來說,是一種事前防范措施。但對整個主機系統(tǒng)產(chǎn)品而言,是一種事后防范措施。如果主機系統(tǒng)生產(chǎn)廠商能把這些防范措施納入整個系統(tǒng)設計過程中,使操作方法更加簡便、更趨于人性化,這將幫助主機維護人員更為妥善處理意外事件,用戶得到更為穩(wěn)定的高性能計算服務。我們相信未來國產(chǎn)的高性能計算機能做到這一點,期待著這一天早日到來。
(為幫助了解,特在附錄中節(jié)選部分雙路斷電關機預案內(nèi)容)
附錄:《曙光4000A超級計算機系統(tǒng)雙路斷電關機操作方法》(省略具體操作步驟)
曙光4000A超級計算機系統(tǒng)雙路斷電關機操作方法
注意:
1、本方法專用于主機房發(fā)生雙路同時斷電緊急操作使用。(包括單線斷電切換失敗)。
2、本方法作為《曙光-4000A超級計算機系統(tǒng)緊急關機操作方法》(SSCS(TS)-XXXX-XXXX-XXXX)的附件。
1.斷電確認及操作:
主機房內(nèi)一旦發(fā)現(xiàn)斷電,并接物業(yè)明確通知為雙路斷電,首先執(zhí)行如下操作(即確保節(jié)點溫度):
1.1打開機房門便于散熱,..
1.2機房通道上布置應急風扇加強冷熱空氣對流,夏季:應急風扇布置..;冬季:應急風扇布置..,使曙光
機房的溫度盡量降低。
1.3打開所有機柜前、后門。
1.4密切注意機房節(jié)點平均溫度(專指各機柜液晶面板所示之環(huán)境溫度值)。
2.緊急關機條件確認:
在完成上述操作后,密切觀察主機房環(huán)境。一旦有如下任何一個條件滿足:
2.1自斷電發(fā)生起,已達到XX分鐘仍未恢復供電;
2.2采取上述緊急通風措施,節(jié)點溫度持續(xù)上升,超過XX℃;
可認定為緊急斷電事件,即刻按下列緊急關機操作方法進行操作。
3.緊急關機操作步驟:
注意事項:
3.1..
3.2關機操作的全過程中,注意隨時保持和物業(yè)的通訊聯(lián)系。除根據(jù)情況隨時聯(lián)絡外,應嚴格保證每XX分鐘與物
業(yè)聯(lián)系一次,詢問UPS可支撐時間及恢復供電可能。(分機、手機、對講機等)
3.3應理解關機原則為:根據(jù)實際電力供應考慮操作步驟,寧慢勿快,在時間允許的情況下,最大程度保證X排節(jié)
點、存儲節(jié)點、SAN和SCSI存儲設備的運行,盡可能減少關閉范圍,以確保恢復。
第一級操作:(首先執(zhí)行)關閉主機系統(tǒng)外圍設備..
第二級操作:(完成上述操作后,當再次發(fā)現(xiàn)UPS電池低于XX分鐘或節(jié)點平均溫度超過XX℃,任一條件滿足,執(zhí)行如下操作)
關閉非重要用戶計算節(jié)點(ABC組)..
第三級操作:(完成上述操作后,當再次發(fā)現(xiàn)UPS電池低于XX分鐘或節(jié)點平均溫度超過XX℃,任一條件滿足,執(zhí)行如下操作)
關閉所有用戶計算節(jié)點(D組)..
第四級操作:(完成上述操作后,當再次發(fā)現(xiàn)UPS電池低于XX分鐘或節(jié)點平均溫度超過XX℃,任一條件滿足,執(zhí)行如下操作)
關閉SAN存儲設備和LSF數(shù)據(jù)庫服務器..
第五級操作:(完成上述操作后,當再次發(fā)現(xiàn)UPS電池低于XX分鐘或節(jié)點平均溫度超過XX℃,任一條件滿足,完成關機操作)
關閉SCSI磁盤陣列和所有存儲節(jié)點..
特別關注:
1.如時間非常緊急,UPS電池低于XX分鐘:
直接執(zhí)行關機腳本:..
此腳本可分別將計算節(jié)點、接入節(jié)點、存儲節(jié)點進行關閉。
2.如時間極其緊急,UPS電池低于XX分鐘,可按《曙光-4000A超級計算機系統(tǒng)緊急關機操作方法》(SSCS(TS)-XXXX-XXXX-XXXX),直接拉閘操作。
(上述二個方法僅用于突發(fā)情況,非極其必要情況下嚴禁使用,應使用前列方法操作)
3.如遇主機失電(如關機操作不及已掉電或突發(fā)自動掉電)應關閉所涉范圍所有設備電閘開關。..
機房應急預案9
第一章 總則
第一條 為規(guī)范我所網(wǎng)絡中心機房設備管理,提高處理機房突發(fā)事件的能力,形成科學、有效、反應迅速的應急工作機制,確保重要計算機信息系統(tǒng)的實體安全、運行安全和數(shù)據(jù)安全,最大限度地減少突發(fā)事件造成的危害,根據(jù)《中華人民共和國計算機信息系統(tǒng)安全保護條例》、《信息化建設員工遵循守則》及《企業(yè)信息安全管理制度》等相關管理規(guī)定等,制定《網(wǎng)絡中心機房應急預案及管理辦法》(以下簡稱管理辦法)。
第二條 本文件適用于有計劃性、有預防性地管理我所的網(wǎng)絡中心機房以及發(fā)生和可能發(fā)生的與機房有關的突發(fā)事件。
第三條 信管部負責編制、修訂網(wǎng)絡中心機房管理辦法及所轄范圍內(nèi)突發(fā)機房事件應急預案。
周期性或即時性地向局域網(wǎng)用戶發(fā)布系統(tǒng)安全警示;對異常流量來源進行監(jiān)控,并妥善處理各種異常情況。及時組織專業(yè)技術人員對所轄范圍內(nèi)機房突發(fā)事件進行應急處置;負責調查和處理機房突發(fā)事件,及時上報并按照相關規(guī)定作好善后工作。
第二章 中心機房管理辦法
第四條 機房內(nèi)的所有設備需要定期保養(yǎng),應指定人員做維護、清潔工作,做到兩天一收拾,一周一打掃;嚴禁將各種食物、飲用品帶入機房,在機房內(nèi)禁止吸煙。
第五條 計算機設備維修工作由專門人員進行,管理人員應把設備的檢修情況記錄在相應的設備卡上,以便統(tǒng)一歸檔管理。如發(fā)現(xiàn)機房設備故障應及時向上級領導報告,并負責計算機及外設的日常維護與排除故障,在遇到設備保修范圍內(nèi)的故障時,應及時催促供應單位上門或將機器送修;
第六條 系統(tǒng)管理人員必須嚴格遵守有關機房、設備及系統(tǒng)運行管理規(guī)定,不得在機房內(nèi)從事與系統(tǒng)管理、運行維護、系統(tǒng)安裝和調測等無關的工作;
第七條 如其他人員需使用機房內(nèi)設備應向機房負責人提交申請,經(jīng)主管人員審核簽字后,將書面申請?zhí)峤恍殴懿看鏅n后方可借用機房內(nèi)的設備;
第八條 做好防火、防雨、防濕、防盜工作,注意用電安全;機房內(nèi)的環(huán)境要每周檢查溫度、濕度、電力系統(tǒng)、是否滿足機房相關的標準要求;
第九條 系統(tǒng)管理人員應定時對機房供電系統(tǒng)及其他運行中的系統(tǒng)、設備進行巡視和檢查,建立檔案,做好系統(tǒng)日志。要對發(fā)生的故障以及排除故障情況做好詳細記錄;機房管理人員每日檢查UPS電源的狀態(tài),確保在突發(fā)停電時,UPS電源能自動供應機房設備正常工作半個小時,保證機房設備的數(shù)據(jù)及時保存。
第十條 要統(tǒng)一管理機房內(nèi)的設備,計算機及其相關設備的驅動程序、保修卡等隨機文件與資料要保存完整。要明確專人負責計算機文檔、信息化等資料的保管,要做到資料齊全,存放安全;
第十一條 機房內(nèi)的交換機和服務器系辦公自動化的'關鍵設備,任何人不得自行配置或更改系統(tǒng)參數(shù);
第十二條 要做好機房的安全工作,對服務器的各種帳戶、密碼嚴格保密。對網(wǎng)絡運行理,設備維修維護、系統(tǒng)或設備安裝等進入機房,必須由機房管理人員陪同進入,做好登記,并配合項目的實施。
第十七條 進入機房的設備應在進入機房前拆除外包裝,以保證機房環(huán)境的清潔和安全。
第十八條 嚴禁攜帶易燃、易爆、易腐蝕等危險性物品進入機房。
第三章 機房用電管理規(guī)定
第十九條 機房內(nèi)提供的UPS電源只允許為主機、服務器、網(wǎng)絡及存儲等核心設備供電,嚴禁安插其他設備,增加UPS電源供電負荷。
第二十條 嚴禁擅自切斷供電系統(tǒng),確因工作需要斷電時,首先應做好相應準備工作,經(jīng)部門領導批準,然后給所有部門發(fā)放斷電通知,最后方可實施。
第二十一條 機房內(nèi)安裝用電設備或有用電需求的項目時,必須經(jīng)過專業(yè)人員或設備提供商的安裝工程師進行現(xiàn)場勘查,經(jīng)確認在滿足或符合要求后工程才能實施。
第四章 機房施工管理規(guī)定
第二十二條 任何進入機房的施工,施工單位必須指明施工管理人員。
第二十三條 施工人員進入機房,必須遵守機房有關管理規(guī)定,不得攜帶與施工無關的物品進入機房,并自覺接受保安人員或機房管理人員的管理、監(jiān)督和檢查。
第二十四條 施工人員未經(jīng)許可不得進入非指定工作區(qū)域,施工前須布置適當?shù)姆雷o設施;施工人員在現(xiàn)場嚴禁吸煙,不得在機房的任何地方坐臥,飲食,或從事與施工無關的事情。
第二十五條 施工人員在施工過程中不得擅自動用機房設施和設備,如因施工管理不善造成機房設施、財產(chǎn)及其他一切經(jīng)濟損失,施工單位必須承擔責任并負責賠償。
第五章 機房安全管理規(guī)定
第二十六條 進入機房的人員必須遵守《機房出入管理規(guī)定》以及有關規(guī)章制度。
第二十七條 機房內(nèi)的設備、工具及相關資料應存放在指定地點,未經(jīng)許可不得私自帶出機房。
第二十八條 機房內(nèi)嚴禁吸煙,嚴禁存放易燃、易爆、易腐蝕等危險性物品,嚴禁動用明火;禁止在電器設備上放置紙張等其它雜物;不得存放與系統(tǒng)運行維護和管理無關的設備、物品和資料。
第二十九條 機房管理人員或保安巡檢員應熟悉機房環(huán)境以及安全通道的位置,應懂得防火知識,滅火常識,熟悉機房消防設施的使用方法,具有及時發(fā)現(xiàn)火災隱患的能力。
第三十條 未經(jīng)批準,不得擅自對網(wǎng)路拓撲結構、連接方式進行修改或拆接,如需作拆接或修改,需經(jīng)信管部經(jīng)理同意后方可進行,并把修改情況記錄在案,未經(jīng)允許,機房管理人員、保安人員不得動用機房內(nèi)的計算機網(wǎng)絡設備,線路等。
第六章 中心機房突發(fā)事件應急預案
第三十一條 機房突發(fā)事件包括網(wǎng)絡設備或服務器故障、自然災害(水、火、電等)造成的物理破壞、人為失誤造成的安全事件等等。 針對突發(fā)事件的預防措施如下:
1、建立安全、可靠、穩(wěn)定運行的機房環(huán)境,防火、防盜、防雷電、防水、防靜電、防塵;建立備份電源系統(tǒng);加強所有人員防火、防盜等基本技能培訓。
2、服務器采用可靠、穩(wěn)定的硬件設備,落實數(shù)據(jù)備份機制,安裝有效的防病毒軟件,及時更新升級掃描引擎;加強對局域網(wǎng)內(nèi)所有用戶和信息系統(tǒng)管理員的安全技術培訓。
第三十二條 機房漏水應急預案如下:
1、發(fā)生機房漏水時,第一目擊者應立即通知機房管理人員。
2、若空調系統(tǒng)出現(xiàn)滲漏水,機房管理人員應立即安排停用故障空調,清除機房積水,并及時聯(lián)系設備供應方處理,同時啟動備用空調,必要情況下可臨時用電扇對服務器進行降溫。
3、若為墻體或窗戶滲漏水,機房管理人員應立即采取有效措施確保機房安全,同時安排通知辦公室,及時清除積水,維修墻體或窗戶,消除滲漏水隱患。
第三十三條 機房火災應急預案如下:
1、完善機房環(huán)境,確保機房FM200自動滅火系統(tǒng)工作正常,設置為滅火系統(tǒng)為自動狀態(tài)。
禁止攜帶易燃易爆物品進入機房。
2、機房管理人員應熟悉機房內(nèi)部消防系統(tǒng)安全操作和規(guī)則,了解機房內(nèi)FM200滅火消防設備操作原理,掌握消防應急處理步驟、措施和要領,懂得滅火的方法,會撲救初起火災,并定期組織滅火演習。
3、一旦發(fā)生火情,要迅速切斷電源(電源已和消防系統(tǒng)聯(lián)動),利用機房專用滅火系統(tǒng)滅火,使用氣體滅火系統(tǒng),要保證機房內(nèi)所有人員全部撤離現(xiàn)場,方可放氣滅火(緊急情況采用手動啟動,見氣體滅火系統(tǒng)操作手冊);如機房氣體滅火系統(tǒng)失效,在保證人員安全的情況下要立即使用備用手持式滅火器手動滅火,同時以最快的方式向主管領導匯報,盡快增加援助人員協(xié)力救火,并迅速撥打物業(yè)管理和119火警電話。
4、等待消防車到來期間,應組織物業(yè)保安或工作人員在保證安全的前提下滅火,應急領導小組應在第一時間內(nèi)集中所有可用滅火器,抓住時機,盡可能的把火撲滅。
5、配合消防部門調查事故原因,對造成的損失和起火原因做好記錄,以便進行災后總結。
第三十四條 雷擊事故應急預案如下:
1、遇雷暴天氣,機房管理人員在下班后應及時關閉所有服務器,切斷電源,暫停內(nèi)部計算機網(wǎng)絡工作。
2、雷暴天氣結束后,機房管理人員應及時開通服務器,恢復內(nèi)部計算機網(wǎng)絡工作,對設備和數(shù)據(jù)進行檢查。出現(xiàn)故障的,事發(fā)部門應將故障情況及時報告信管部。
3、因雷擊造成損失的,機房管理人員應會同相關部門進行核實、報損,并在調查工作結束后一日內(nèi)書面報告領導。
第三十五條 設備防盜被盜或人為損害應急預案如下:
1、機房管理人員每日查看、清點設備并鎖好機房大門。
2、機房管理人員每日檢查錄像監(jiān)控服務器狀態(tài),確保監(jiān)控畫面正常,并檢查每日錄像正常性、完整性。
3、發(fā)生設備被盜或人為損害設備情況時,使用者或管理者應立即報告信管部負責人,同時保護好現(xiàn)場。
4、信管部接報后,通知保安及公安部門,一同核實審定現(xiàn)場情況,清點被盜物資或盤查人為損害情況,做好必要的影像記錄和文字記錄。
5、事發(fā)單位和當事人應積極配合公安部門進行調查,并將有關情況向信管部匯報。
第三十六條 機房停電應急預案如下:
接到停電通知后,信管部應及時通過辦公系統(tǒng) 、電話等發(fā)布相關信息,部署應對具體措施,要求涉及到的工作人員在停電前停止業(yè)務、保存數(shù)據(jù)。
1、確認電力可能恢復的時間,立即通知中心機房電源維護負責人和中心機房各設備的負責人到達現(xiàn)場,做好各機房停電準備。
如果確認機房停電的時間為短時間停電,立即可以恢復供電的情況(如15分鐘以內(nèi),根據(jù)UPS電池使用周期和壽命,電池后備時間將會減少,應根據(jù)現(xiàn)場實際情況,留出機房設備正常關機時間),可以在UPS正常供電的時間內(nèi),應密切觀察UPS帶負載時間,等到電力恢復,期間如UPS剩余時間低于50%(應滿足機房設備正常關機時間),機房負責人應立即嚴格按操作手冊停掉機房內(nèi)的所有設備(包括各應用服務器、存儲、核心交換機和路由期等設備的電源,以及機房輔助設備的電源,最后關閉UPS(見UPS操作手冊),等待電力恢復,電力恢復供電后轉第七條執(zhí)行。
如果不能確認恢復供電時間,立即匯報給機房電源維護負責人和中心機房各設備的負責任到達現(xiàn)場。做好各設備的電源停電準備,嚴格按操作手冊停掉機房內(nèi)的所有設備(包括各應用服務器、存儲、核心交換機和路由期等設備的電源,以及機房輔助設備的電源,最后關閉UPS(見UPS操作手冊),等待電力恢復,電力恢復供電后轉第4條執(zhí)行。
2、機房維護負責人將停電的電源柜總空開和分空開的狀態(tài)處于斷開狀態(tài),關閉順序應為,先關閉回路小開關,再關閉總開關(UPS關閉后,應先關閉UPS輸出回路開關,再關閉UPS輸出總開關,接著關閉UPS輸入開關)并向主管領導匯報。
3、將掉電的所有的設備電源狀態(tài)處于下電狀態(tài),以防止電源柜加電對設備的沖擊。
4、電力室恢復供電后,先不要急于給電源柜加電,等待10-20分鐘后,再開始給電源柜加電,以防止供電不穩(wěn)或再次掉電。
5、供電正常后,確定設備處于下電狀態(tài)后,打開電力柜的總控開,開啟UPS的市電輸入開關,開啟UPS(見UPS操作)。
6、根據(jù)設備加電順序,啟動分路空開。
7、設備加電順序,網(wǎng)絡設備正常后再給服務器、存儲等設備加電開機。(以上各設備務必按操作手冊的啟動順序上電)。
8、設備啟動正常后,開始啟動數(shù)據(jù)庫。
9、數(shù)據(jù)庫啟動正常后,開始啟動中間件服務器。
10、中間件服務器正常后,啟動應用程序。
第三十七條 通信網(wǎng)絡故障應急預案如下:
1、發(fā)生通信線路中斷、流量異常等故障后,員工應及時通知信管部人員。
2、信管部在接到報告后,迅速組織相關技術人員檢測故障區(qū)域,并作相關故障處理,必要時通知通信網(wǎng)絡運營商查清原因;逐步恢復故障區(qū)與服務器的網(wǎng)絡聯(lián)接,恢復通信網(wǎng)絡,保證正常運轉。
3、應急處理結束后,信管部應在一日之內(nèi)提交故障分析報告,以便備案。
第三十八條 服務器故障應急預案如下:
1、機房管理人員每日檢查機房設備工作狀態(tài),確保系統(tǒng)運行的完善。
2、機房管理人員定期備份數(shù)據(jù)和資料,并將備份資料刻錄成光盤或拷貝到移動硬盤。
第三十九條 發(fā)生機房突發(fā)事件后,信管部應采取有效措施開展先期處置,恢復信息網(wǎng)絡正常狀態(tài)。應急處置工作結束后,信管部對事件發(fā)生原因、性質、影響、后果、責任及應急處置能力、恢復重建等問題進行全面調查評估,根據(jù)應急處置中暴露出的管理、協(xié)調和技術問題,改進和完善預案,實施針對性演練,總結經(jīng)驗教訓,整改存在隱患,組織恢復正常工作秩序。
第七章 附則
第四十條 信管部會結合信息網(wǎng)絡快速發(fā)展和經(jīng)濟社會發(fā)展狀況,配合相關法律法規(guī)的制定、修改和完善,適時修訂管理辦法。
第四十一條 本文件由信息管理部制定并負責解釋。
第四十二條 本文件經(jīng)批準后發(fā)布實施。
20xx年05月10日
上海市xx信管部
機房應急預案10
第一章:總則
第一條:編制目的
為了提高股份有限公司對各類消防安全事故的應急響應和處理能力,建立快速有效的應急保險、救援機制,最大限度地減輕火災、消防安全事故造成的損失,根據(jù)本股份有限公司的實際情況制定本預案。
第二條:編制依據(jù)
以《中華人民共和國突發(fā)事件應對法》、《中華人民共和國消防法》為法律依據(jù)。
第三條:適用范圍
本預案適用于股份有限公司范圍內(nèi)發(fā)生的消防安全事故。
第四條:工作原則
應急處理應遵循輕重緩急原則,股份有限公司各部門和各部門在火災事故預防和應急處理工作中,應遵循預防為主,常備不懈的方針,貫徹集中領導、等級管理、統(tǒng)一指揮、運行效率的原則。
第二章:緊急訓練
第五條:消防設備的使用原理和方法
一、手提式干粉滅火器
1、ABC干粉滅火器主要由裝有粉末的粉桶、儲存二氧化碳的鋼瓶、裝有進氣管和出氣管的器頭和輸送粉末的管道構成。
2、ABC干粉滅火器主要適用于石油及其產(chǎn)品、可燃氣體和電氣設備的首次起火。
3、使用ABC干粉滅火器時,首先拔掉保險銷,握住粉管的前端,使噴嘴對準火源,另一只手握住導向盤,按下針,噴出干粉。
4、ABC干粉滅火器應保持干燥、密封,防止干粉結塊。同時,防止陽光暴露,防止二氧化碳因熱膨脹而漏氣。定期檢查干粉是否結塊,二氧化碳氣量是否充足。干粉滅火器分為手提式和小車式兩種。
二、1211滅火器
1、1211滅火器主要由筒體(鋼瓶)和筒蓋兩部分組成。鋼瓶裝滿1211滅火劑,筒蓋裝有壓力把、壓力棒、噴嘴、密封閥、虹吸管、保險銷等。
2、1211滅火器主要適用于油類、精密機械設備、儀表、電子設備和文物、書籍、文件等貴重物品的首次起火。
3、使用時,先拔掉保險銷,然后握住按鈕開關,按鈕打開密封閥,1211滅火劑在氮氣壓力下,用虹吸管從噴嘴噴出。松開壓把開關,噴射即中止。
4、1211滅火器應放置在不受日照、火烤的地方,但要注意防潮,防止劇烈振動和沖突。定期檢查壓力表,發(fā)現(xiàn)低于使用壓力的十分之九時,請再次充氣。同時,必須定期檢查重量,如果重量低于顯示的十分之九,必須重新注入藥物。1211滅火器分為手提式和小車式兩種。
三、其他消防工具
1、消防栓:消防栓是連接消防供水系統(tǒng)的閥門裝置,分為室內(nèi)消防栓和室外消防栓兩種。
2、龍帶:常用龍帶有內(nèi)扣式和壓簧式兩種。水龍帶平時要卷在通風干燥的地方,防止腐爛。龍帶是連接消防泵(或消火栓)和水槍等噴射裝置的輸水管道。
3、消防水槍:水槍是提高水流速度、射程、改變水流形式的消防滅火工具。根據(jù)水槍噴射的水流,分為直流水槍、開花水槍、噴霧水槍、開花直流水槍等,直流水槍是噴射密集充實水流的水槍。開花水槍是噴射密集充實水流的'水槍,可以根據(jù)滅火的需要噴射開花水,冷卻容器外壁,阻止放射熱,掩護滅火者接近著火點。噴水槍是在直流水槍的槍口安裝雙級離心噴水頭,使水流在離心力的作用下,使壓力水變成霧。噴霧槍噴出的霧狀水流適用于救援油類火災和油浸變壓器、多油式斷路器等電氣設備火災。開花直流水槍是一種可以噴射充實水流,也可以噴射傘形開花水流的水槍。
第六條:每年指定負責人對運行、檢查、安全生產(chǎn)管理等應急人員進行防火知識、技能訓練。包括如何報警、如何使用滅火器、火場逃生、燒傷燒傷處理、外傷止血包扎等。
第七條:本預案每兩年由保安部門負責組織各部門及有關部門應急人員進行全面訓練,每年進行組合訓練或單項訓練。訓練結束后,必須總結和評價訓練結果,及時修改本預案在訓練中暴露的問題和不足。
第八條:每年保安部負責對股份有限公司員工進行防火安全教育,了解火災事故的發(fā)生原因,了解事故現(xiàn)場救護的方法,了解各種警報的意義和緊急救援工作的要求。不斷增強股份有限公司員工的消防安全意識,減少和避免火災事故的發(fā)生。
第三章:緊急措施
第九條:火災事故的應急過程主要以火災、醫(yī)療救治、貴重設備救治等為主要任務。
第十條:消防安全事故發(fā)生時,可及時有效處理緊急情況,全股份有限公司所有人員在保證自身安全的情況下,按照負責人的指揮最大限度地保證員工的人身安全和股份有限公司的財產(chǎn)安全,按照救人第一和快速有效的處理事故原則,立即滅火、危險、危險、危險、危險
第十一條:全股份有限公司消防設備、指定車輛、照明設備、防護設備、救護物品等,可作為緊急設備資源。
機房應急預案11
機房是我單位的重要場所,重要儀器、設備相對集中,一旦發(fā)生事故,會造成嚴重后果 。為此特制定本應急預案。
一、觸電
(1) 一旦發(fā)生觸電事故,應迅速安全切斷電源,切忌直接接觸觸電者。
(2) 即刻撥打緊急電話120并通知相關領導,同時開展現(xiàn)場應急救護 。
二、火災
1、報警程序:
即刻通知領導及相關部門,根據(jù)火情大小如需報警立即就近用電話或手機報告消防中心(電話119).。
2、組織實施:
機房管理員一旦發(fā)現(xiàn)火情后,應即刻切斷電源,并使用滅火器撲救起火設備。
三、空調漏水
若空調系統(tǒng)出現(xiàn)滲漏水,應立即安排停用故障空調,清除機房積水,并及時聯(lián)系設備供應方處理,同時臨時用電扇進行降溫。
四、設備發(fā)生被盜或人為損害事件
( 1)發(fā)生設備被盜或人為損害設備情況時,使用者或管理者應立即報告中心負責人,同時保護好現(xiàn)場。
( 2)中心負責人接報后,通知保衛(wèi)處,一同核實審定現(xiàn)場情況,清點被盜物資或盤查人為損害情況,做好必要的影像記錄和文字記錄。
( 3)當事人應當積極配合公安部門進行調查, 并將有關情況向領導匯報。
五、機房停電
(1)接到長時間停電通知后,應及時發(fā)布相關信息,部署應對具體措施。
(2)如遇臨時停電,且停電時間在3小時之內(nèi),管理員要檢查UPS是否正常工作,以確保機房設備的正常運行。。
六、網(wǎng)絡故障
(1)發(fā)生通信線路中斷、路由故障、流量異常等故障后,網(wǎng)絡管理員應及時查清通信網(wǎng)絡故障位置,隔離故障區(qū)域,組織相關技術人員檢測故障區(qū)域,逐步恢復故障區(qū)與服務器的網(wǎng)絡聯(lián)接,恢復通信網(wǎng)絡,保證正常運轉。
(2) 事態(tài)或后果嚴重的,應及時報告領導并請求協(xié)助解決。
七、不良信息和病毒事件
(1)發(fā)現(xiàn)不良信息或網(wǎng)絡病毒時,管理員應立即斷開網(wǎng)線,終止不良信息或網(wǎng)絡病毒傳播,并報告。
(2)中心負責技術人員應采取隔離網(wǎng)絡等措施,及時殺毒或清除不良信息,并追查不良信息來源。
(3)事態(tài)或后果嚴重的',應及時報告相關領導以及相關部門。
八、服務器軟件系統(tǒng)故障
(1)發(fā)生服務器軟件系統(tǒng)故障后,在確認安全的情況下,重新啟動故障服務器系統(tǒng);重啟系統(tǒng)成功,則檢查數(shù)據(jù)丟失情況,利用備份數(shù)據(jù)恢復;
(2)若重啟失敗,應立即安排備份服務器啟用,并請求技術人員支援,作好技術處理。
九、注意事項:
第一、機房管理員要加強日常監(jiān)控,及時處理、消除及上報安全隱患。
第二、備齊安全相關裝備。
第三、及時做好備份。
機房應急預案12
信息中心機房是就業(yè)中心開展各項工作的重要保障,也是重點消防部位。為了應對消防事故的發(fā)生,特制定以下應急預案:
一、機房消防安全堅持“標本兼治、綜合治理,防消結合、預防為主”的基本原則,堅持嚴防死守,確保萬無一失。
二、加強單位職工的安全教育,全面提高應對火災的'能力和心理素質,把損失和危害減少到最低程度。
三、加強領導,健全機構,成立機房消防安全責任小組。 組 長:
副組長:
責任人:當班人員、信息中心工作人員
四、正確處置消防事件:
1、發(fā)現(xiàn)火情后,迅速切斷電源,利用就近滅火器滅火;如不能及時控制、撲滅火災,立即啟動應急預案,以最快的方式向上級報告,并視火情立即撥打119報警;
2、接到火警后,組長、副組長及工作人員應在最短時間內(nèi)迅速趕赴現(xiàn)場進行撲救;
3、及時搶救重要設備,并引導人員疏散自救。
4、一旦有人受傷應及時實施搶救,并及時撥打120請求救護支援;協(xié)助醫(yī)護人員對受傷人員進行緊急救護等;
5、火警解除后,及時保護現(xiàn)場,看護設備,防止次生事故發(fā)生,并及時向上級匯報火情和損失,配合相關人員進行事故調查。
五、注意事項
1、避免人身傷害,撲救要在確保人員不受傷害的前提下進行。
2、火災第一發(fā)現(xiàn)人應查明原因,如是電源引起,應立即切斷電源。
3、逃生時應盡量采取保護措施,如用濕毛巾捂住口鼻,用濕衣服包裏身體。同時啟用消防應急通道,嚴禁擁擠、阻塞和跳樓、跳窗等事件發(fā)生。
4、堅持預防為主,堅持安全值班巡查制度,嚴守機房消防安全管理制度,保持通信工具暢通,發(fā)現(xiàn)隱患及時上報處理。
6、認真分析事故原因,總結經(jīng)驗教訓,虛心接受有關部門的檢查、指導、批評和教育。
機房應急預案13
為建立有效防范和處理火災事故的工作機制,防范消防安全事故的發(fā)生,力保消防安全事故發(fā)生時能夠快速、高效、合理有序地處置,特制定本預案。一.機房火災隱患分析 由于機房內(nèi)電氣設備多,線路復雜,大部分的火災都是電氣火災,引發(fā)電氣火災的主要因素有:
1.電氣線路短路、過載、接地電阻過大等引發(fā)火災。 2.由于機房內(nèi)的電腦、空調、UPS等設備長時間不間斷運行或設備故障引發(fā) 火災。 3.靜電產(chǎn)生火災。 4.雷電等強電入侵引發(fā)火災。 二.處置程序 1.發(fā)現(xiàn)火情后,迅速切斷電源,利用就近滅火器進行滅火,并按照特級事故 通報機制進行通報,向領導匯報火災具體情況。
2.迅速組織相關人員攜帶消防器具趕赴現(xiàn)場滅火,并聽從現(xiàn)場指揮人員指揮。
3.如火情較為嚴重,應立即與大廈消防中控取得聯(lián)系,并與之協(xié)商處理辦法 措施,必要時需要專業(yè)消防滅火的,迅速撥打119。 4.迅速組織相關人員對重要數(shù)據(jù)設備進行轉移,盡可能保證關鍵設備安全, 引導人員進行疏散。 三.撲救方法 1.電源或線路起火應首先切斷電源,絕不能用水撲救。 2.撲救機房設備時,最好使用氣體(如CO2)滅火器,干粉,泡沫滅火器會對設 備造成 腐蝕,使損失增大。 四.注意事項
1.一旦機房發(fā)生火災,應遵循以下原則:首先保證人員安全;其次保證關鍵設 備安全;再保證一般設備安全。 2.火災發(fā)生時,第一發(fā)現(xiàn)人查明起火原因,如因電源引起,應首先切斷電源。
3.火災發(fā)生后應遵循邊救火,邊報警的原則。 五.預防措施
1.設備整改:機房現(xiàn)有的電氣設備和消防設備均有存在不合理之處,需要整改, 消除隱患。現(xiàn)有的配電開關為墻上的半埋式家用配電開關,應更換為專業(yè)的` 獨立空氣配電箱,修改配電柜各類閘刀和開關的布局,使其具備獨立切換 的功能。 現(xiàn)有的滅火器為干粉滅火器,且維護也已過期,干粉滅火器雖然 可以有效滅火,但是會對設備造成腐蝕,損壞設備,應更換為氣體滅火器。
2.每天定時對機房重要電氣設備和電子設備的溫度進行了監(jiān)控,能夠及時地發(fā) 現(xiàn)并消除隱患。 3.應組織相關人員進行消防安全教育,學習消防知識,學會正確使用各種滅火器,有計劃的進行相關的消防演習。
機房應急預案14
為了應對各種突發(fā)和緊急事件,特制訂以下方案。
一、突發(fā)和緊急事件指自然因素或其它原因引起(或可能引起)基站財產(chǎn)安全或較多基站中斷的所有事件。
二、啟動基站維護(緊急)組織實施方案的范圍:梅雨季節(jié)地勢低洼基站的防汛;雷電高峰期基站的動力搶修或搶險;大雪(暴雪)基站房屋及鐵塔的維護及應急搶修工作;臺風、地震前中后基站及鐵塔的維護;傳輸或MSC(BSC)故障造成基站大面積故障,故障恢復后基站網(wǎng)絡的測試。
三、啟動基站維護(緊急)組織實施方案的條件:天氣和各種地質災害預報或由此可造成(或正在造成)基站的財產(chǎn)安全和網(wǎng)絡穩(wěn)定運行,網(wǎng)管統(tǒng)計發(fā)現(xiàn)大面積網(wǎng)絡故障時必須立即啟動基站維護(緊急)組織實施方案。
四、對于由自然因素可能引起的基站及分布系統(tǒng)站點的財產(chǎn)安全和網(wǎng)絡穩(wěn)定運行,得知地質或天氣預報后,立即組織各代維項目部區(qū)和相關工程施工單位對所在地的站點進行預防性巡檢,對于各種隱患要求各項目部現(xiàn)場及時上報給我公司災害預防和處理應急領導小組和各地移動公司應急領導小組。
五、我公司應急領導小組成員和各代維項目部所有維護人員在重大災害預防和搶險過程中的的移動電話必須24小時開機,必須無條件服從公司應急領導小組和代維項目經(jīng)理統(tǒng)一安排,若某項目出現(xiàn)人員不足的情況下,公司臨時從總部或異地抽調人員和車輛參加搶險;凡當?shù)匾苿庸舅犝军c不是我公司維的護站點出現(xiàn)重大險情后,我公司抗災任務又不重時,各項目部要主動向移動請纓。
六、公司在每一次抗災救險活動結束后
公司應急領導小組應對本次活動的'成功經(jīng)驗和教訓進行總結,對表現(xiàn)優(yōu)秀的團隊或個人進行表彰,表現(xiàn)較差的團隊或個人進行處罰
七、重大災害預防和搶險的人員組織機構:
領導小組由總經(jīng)理,副總經(jīng)理,各部門經(jīng)理及地區(qū)經(jīng)理組成,總經(jīng)理為總指揮,各代維項目部也應成立相應成立相應的抗災救險領導小組。
八、抗災救險人員安排:
公司總部和各代維項目部應包括以下小組
1、通信保障組:在發(fā)生險情時提供移動通信應急保障,負責實施應急通信的詳細方案、應急中所需的備品、備件、測試儀表、工具、技術資料的保管及預防性維護保障工作。
2、物資調撥組:負責所有應急物資日常保管、定期檢查、更新以及應急時的調撥和運送。
3、搶險救災組:負責應急時的搶修和救災方案的實施
九、值班制度
1、各代維項目部在啟動抗災救險預案后應實行24小時值班制度,設立固定值班地點和24小時值班熱線。
2、全體應急人員保持24小時開機。
3、在接到上級關于進入應急狀態(tài)的通知后,即由領導小組成員組成指揮中心。
十、體保障措施細則:
1、根據(jù)每年的雨情在進入梅雨季節(jié)后將基站及分布系統(tǒng)代維的工作重點轉為重點機房、基站等重點防汛場所的巡視,故障處理。在遇到突發(fā)或緊急時間期間,加強對重點基站、低洼基站及傳輸機房的巡視,確保環(huán)境監(jiān)控系統(tǒng)工作正常。重點基站及傳輸機房一周一次,低洼基站二周一次。臺風期間每天對拉線塔進行巡檢,并填寫基站巡檢表。
2、重點保障地點預置好防汛搶險物資。并給各維護小組配備部分隨車搶險物資。如編織袋、鐵鍬、雨衣、雨靴、防火泥、防火包、手電等。對抽水泵,移動油機進行保養(yǎng),確保其工作正常。對應急燈、應急手機定期充電。
3、出現(xiàn)連續(xù)暴雨或臺風情況時,維護人員每天對重點站點及所有拉線塔進行巡視,填寫基站巡檢表。發(fā)現(xiàn)緊急情況立即通知我公司地區(qū)經(jīng)理和移動代維管理人員,由代維管理人員上報移動部門領導,并趕赴現(xiàn)場確認,視情況確定是否安排專人(人員由綜合部安排)進行24小時值守。
4、網(wǎng)管值班人員對環(huán)境監(jiān)控設備出現(xiàn)的告警密切觀察并記錄,若確有異常情況發(fā)生,立即通知我代維人員趕赴現(xiàn)場檢查。并追蹤代維人員的處理情況和反饋結果,若發(fā)現(xiàn)代維人員未及時處理,我網(wǎng)管值班人員應立即向我公司和移動公司匯報。
5、進入汛期后由各項目部負責每天了解所在區(qū)域的水位情況,并通知網(wǎng)管值班人員,由網(wǎng)管值班人員通知我代維人員及移動代維管理人員,根據(jù)水位情況合理調度巡視隊伍與車輛。
6、收到臺風警報后,各項部項目經(jīng)理立即組織代維人員對全區(qū)拉線塔進行巡檢,發(fā)現(xiàn)異常發(fā)現(xiàn)緊急情況立即通知移動代維管理人員和我公司應急領導小組,視情況確定應急措施。
7、收到大雪或暴雪預報,組織維護人員對所轄基站中拉線塔基站、彩鋼瓦基站進行重點巡檢,當?shù)玫骄W(wǎng)管或其他人員通知所轄基站中有拉線塔基站、彩鋼瓦基站出現(xiàn)故障或非正常情況,立即派搶修人員奔赴現(xiàn)場,并逐級上報。
機房應急預案15
核心機房電力的保障一直是維護體系的頭等重要事項,通過實施應急發(fā)電演練,建立了可靠的應急預案機制,最大限度的降低電源中斷對網(wǎng)絡傳輸質量的影響。現(xiàn)分享核心機房電源中斷應急預案,希望分公司盡快建立一套統(tǒng)一指揮、職責明確、反應迅速、處置有力的機房安全保障機制。
組織架構:
責任領導、工程維護、網(wǎng)絡監(jiān)控、網(wǎng)絡運維、質量管理等相關人員。
機房電源系統(tǒng)說明:
1、機房電力是兩路三相四線制供電,進線線纜規(guī)格為:RVV50*4+16*1銅芯護套線。
2、機房電源系統(tǒng)采用三級防雷系統(tǒng),三級防雷分別位于電源進線端、UPS輸入前端。
3、機房現(xiàn)有兩臺60KVA-UPS電源,均處于正常運行狀態(tài)。
4、機房現(xiàn)有設備機柜已編號,均通過UPS電源和市電供電,每個機柜有獨立的20A空氣開關。空調、墻壁插座開關、應急燈、照明等都是單獨空開接市電。
5、運行中的UPS電源所帶負荷,在逆變運行狀態(tài)下能正常工作約4小時(已經(jīng)過UPS放電測試)。
一、核心機房電源中斷預案
1、在接到停電通知的情況下:
1)計劃性停電通知要確保綜合部、工維機房管理部對口人接到通知(提前將對口聯(lián)系人備案在物業(yè)處),機房管理員接到計劃停電通知后,升級到調度中心進行信息發(fā)送,同步進行郵件通知相應應急小組成員。并與負責組長及責任領導電話告知,確保已經(jīng)接收到本次停電的時間及可能發(fā)生的情況。
2)維部進行發(fā)電應急預案小組成員通知,提前做好機房發(fā)電預案要求的準備工作,將相應的發(fā)電機、連接線、人員安排到位,各司其職,隨時待命現(xiàn)場,做發(fā)電準備工作。確保停電時刻的電力安全及機房用電的保障措施,提前調度安排好相應人員做好保障用電的措施。
3)計劃停電時間開始后,馬上啟動應急發(fā)電操作,按照機房發(fā)電操作步驟實施階梯供電的步驟,恢復市電保障。并進行現(xiàn)場值守及設備工作確認,確保全部正常后電話告知調度中心及維護體系領導。
2、在沒有接到任何通知,突然發(fā)生停電的情況下:
確認停電線路,停電時刻,停電時間等要素,啟動核心機房發(fā)電應急預案。
1)值班網(wǎng)管工作流程:
⑴值班網(wǎng)管監(jiān)控到核心機房停電,第一時間告知工維部、網(wǎng)絡部、運維部應急小組組長。信息傳達到工維部機房管理員(一主一備),告知停電開始時間。
要求在停電5分鐘內(nèi)將消息傳達到調度中心,各應急小組組長。如無法聯(lián)系上,進行升級到責任領導-工維部經(jīng)理經(jīng)理處。
⑵網(wǎng)管將停電信息電話傳達后,進行調度派單,確保全部的應急小組成員都收到本次故障停電的信息。然后進行機房中設備的檢查,包括:UPS設備主機、各核心設備、匯聚設備、服務器、語音系統(tǒng)等。檢查是否受影響。同時啟動機房降溫措施(降溫方案:初步為加裝抽排風設備、增加大風扇排風形成熱量流動降溫)
⑶實時監(jiān)控設備及UPS工作情況,包括:電量下降情況,設備工作正常情況,每15分鐘通報一次電量情況。
2)運維部應急工作流程:
⑴運維應急同事接到故障通告后,第一時間往停電現(xiàn)場趕,到現(xiàn)場配合網(wǎng)管/工維部門進行設備儀器的檢查、客服語音系統(tǒng)的保障,應急發(fā)電的協(xié)助。
⑵現(xiàn)場配合進行機房降溫散熱措施實施,實時檢查網(wǎng)絡設備的工作情況。
3)運營質量管理應急工作流程:
⑴調度中心值班人員接到網(wǎng)管監(jiān)控調度信息后,第一時間將故障信息記錄并發(fā)故障通告到相關應急成員,并電話通知各應急小組組長是否知悉。
⑵進行客服調度系統(tǒng)的設備工作運行系統(tǒng)檢查,特別語音系統(tǒng)級坐席電腦,是否有問題,如發(fā)現(xiàn)工作系統(tǒng)有異常,及時與運維應急小組成員溝通,進行檢查處理。
⑶實時關注故障工單流程進度登記,配合應急小組進行人員調度通告。
4)工維部應急工作流程:
⑴機房管理員第一時間往停電現(xiàn)場趕,同時進行電話溝通供電公司、物業(yè)方等,咨詢停電原因,是屬于計劃性還是突發(fā)性停電,預計停電時長,將咨詢清楚的結果反饋到應急小組成員中,電話聯(lián)系物業(yè)溝通好需要發(fā)電需求申請。
⑵工維應急小組組長接到時間后第一時間往停電現(xiàn)場趕,同時進行發(fā)電應急小組成員調度,安排第一時間到場工作開展,并升級通報告知主管領導,對口集團維護中心上報信息。
⑶工維應急小組成員接到停電時間后第一時間往停電現(xiàn)場趕,要求30分鐘內(nèi)必須到場(住機房附近的.人員往現(xiàn)場去,較遠同事可以進行打車往現(xiàn)場去),先行到處同事配合網(wǎng)管、運維同事啟動做好應急發(fā)電前的準備:連接線布放、接續(xù)、發(fā)電機發(fā)電前檢測油/電/水路檢查,確保正常。確保一切就緒后,確認可以進行發(fā)電操作后,按照發(fā)電操作流程進行發(fā)電恢復市電。
⑷網(wǎng)管將監(jiān)控到停電的相應信息及級別同步發(fā)送到運營質量管理部調度崗,由調度崗將相應信息進行工維、運維、網(wǎng)絡關聯(lián)同事進行信息告知,同時報工維主管領導知悉。
5)應急機房發(fā)電操作流程:
⑴機房用電系統(tǒng)包括四方面:空調制冷、主/備UPS主機、照明系統(tǒng)、客服調度系統(tǒng)。
⑵發(fā)電前考慮4方面系統(tǒng)設備用電功率情況,為保障發(fā)電機帶動的正常,不能進行同步供電,要區(qū)分優(yōu)先恢復的步驟實施,確認發(fā)電機的工作正常。在發(fā)電前將需要供電的“空調制冷、主/備UPS主機、照明系統(tǒng)、客服調度系統(tǒng)”的市電輸入主開關關閉。防止同步啟動時發(fā)電機的無法供電保證。
⑶啟動發(fā)電機,檢測發(fā)電輸出電流通斷,待發(fā)電機運行穩(wěn)定后。
第一步啟動空調制冷系統(tǒng)的市電輸入開關,運維應急小組成員重新啟動空調主機(空調因為市電恢復后需要重新啟動)觀察空調制冷工作是否正常。
第二步啟動主UPS設備的市電輸入開關,觀察發(fā)電機運行穩(wěn)定情況,主UPS主機工作穩(wěn)定情況,網(wǎng)絡設備的工作正常與否。
第三步啟動客服系統(tǒng)的市電輸入開關,包括(客服坐席電腦、UPS設備、空調制冷等),觀察發(fā)電機運行穩(wěn)定情況,設備恢復工作情況。
第四步啟動備UPS設備、市電照明的市電輸入開關,觀察發(fā)電機運行穩(wěn)定情況,備UPS主機工作穩(wěn)定情況,網(wǎng)絡設備的工作正常與否。
⑷發(fā)電機啟動,市電輸入正常后,網(wǎng)管將降溫系統(tǒng)的抽排風設備關閉,與運維同事進行所有設備的運行進行全面的檢查,確保設備已經(jīng)是運行正常。
⑸發(fā)電機發(fā)起市電正常后,工維應急小組安排專人現(xiàn)場值守,及時關注發(fā)電機油量情況,同時與油品供應商確認油品配送要求及時間要求,并實時與供電部門確認市電恢復時間。
6)停電過程中突發(fā)事項預防:
⑴網(wǎng)管在停電時進行機房確認運行中的UPS工作組、設備組工作狀態(tài)。主/備UPS工作切換是否正常,在市電中斷時UPS是否已經(jīng)開始進行供電保護。
⑵值班網(wǎng)管對機房中的所有設備進行全面檢查,確保所有的設備已經(jīng)是有主備供電,市電中斷后UPS已經(jīng)正常保障設備工作。同時對機房的溫度進行觀察,溫度是否突然升高。
⑶停電后,UPS處于逆變工作狀態(tài),當班人員要每隔15分鐘觀察一次UPS的蓄電池容量、帶負荷情況、機房環(huán)境溫度,盡量使蓄電池容量大于60%,帶負荷小于85%(因為已經(jīng)有自購發(fā)電機應急,盡快要求短時間發(fā)起電,減少UPS的放電過度)。
⑷發(fā)現(xiàn)機房環(huán)境溫度大于26℃。當以上指標不能保證時,要及時向機房管理員匯報,同時上報責任領導知悉,網(wǎng)管預案小組成員經(jīng)過慎重討論,適時采取關閉不必要網(wǎng)絡的網(wǎng)絡設備、加強通風降溫等措施盡量延長關鍵設備運行時間。
【機房應急預案】相關文章:
機房防汛應急預案04-25
機房應急預案(精選15篇)11-13
機房火災應急預案(精選10篇)11-10
公司機房消防應急預案(精選9篇)11-19
熱力公司機房消防應急預案(精選12篇)06-09
應急預案01-14
手足口病應急預案_應急預案04-27
應急疏散應急預案04-10