有些事情,比如說系統(tǒng)的恢復(fù),看上去似乎很簡單,但在實(shí)際操作中卻變得越來越復(fù)雜,讓人感到難以解釋。有些時候,之所以會出現(xiàn)這種情況是因?yàn)椴煌娜丝磫栴}的視角不同--比如說IT人員和用戶之間就存在這種問題;畢竟,同大多數(shù)用戶相比,IT人員對系統(tǒng)的了解要全面細(xì)致的多。但是,還有一些時候,這種情況的出現(xiàn)是由一種誤解造成的:什么是最重要的?IT人員和用戶的理解自然不同。我自己也是在親身經(jīng)歷了慘痛的教訓(xùn)之后才了解這些問題的。
我的經(jīng)歷
我負(fù)責(zé)的由初級網(wǎng)絡(luò)建筑師和高級網(wǎng)絡(luò)工程師組成的IT小組曾經(jīng)負(fù)責(zé)一個網(wǎng)絡(luò)安裝項(xiàng)目。美國山區(qū)時間一天早晨四點(diǎn),我們忽然接到電話,報(bào)告系統(tǒng)出現(xiàn)了問題。幸運(yùn)的是,當(dāng)時我們正在處理測試中的信息中樞出現(xiàn)的一些問題,所以大家的頭腦都很清醒。我與電話中心的負(fù)責(zé)人通了話。主要的數(shù)據(jù)中心出現(xiàn)了問題。全部中樞服務(wù)都關(guān)閉了。他需要我們的幫助,需要趕在東海岸的人們上班之前恢復(fù)一些服務(wù)。
我讓自己手下一半的員工回了酒店,另外一半留下來處理問題。在經(jīng)過了最初幾個小時的混亂之后,我們已經(jīng)使相當(dāng)部分的系統(tǒng)運(yùn)行起來,足夠用戶的穩(wěn)定使用了。與此同時,電話中心和數(shù)據(jù)中心的工作小組也在拼命工作。當(dāng)先回酒店休息的另外一半小組成員睡醒之后,他們也立即趕來協(xié)助。
我們在非常短的時間內(nèi)迅速完成了郵件系統(tǒng)的改裝,使其不再依賴中央網(wǎng)絡(luò)服務(wù)器,這樣做雖然使郵件的路由變得復(fù)雜了,卻使服務(wù)得到了恢復(fù)。幾天后,ERP系統(tǒng)也完全恢復(fù)了正常。
盡管剛開始的時候情況有些混亂,但是從總體上來看,IT小組對于此次系統(tǒng)恢復(fù)過程還是相當(dāng)滿意的。我們面對非常困難的情況作出了迅速的反應(yīng),通過連續(xù)奮戰(zhàn)使服務(wù)得到了恢復(fù),甚至還通過一個新設(shè)計(jì)的電話系統(tǒng)隨時向公司的管理人員和員工通報(bào)系統(tǒng)恢復(fù)的進(jìn)展情況。的確,有些工作我們是可以以更高的效率完成的。但是,我們畢竟也是普通人,不可能保證以最高的效率完成所有的工作,這點(diǎn)應(yīng)該是大家可以理解的。
但是,我們的好心情沒能持續(xù)多長時間。由于無法得到自己想要的信息,客戶們開始感到憤怒。從定貨到貨品發(fā)送,大多數(shù)用戶在尋找自己需要的數(shù)據(jù)時都遇到了困難。有的用戶甚至公開質(zhì)疑IT部門在過去的三天內(nèi)是否確實(shí)采取了恢復(fù)系統(tǒng)的行動。
我與IT用戶組的一個負(fù)責(zé)人(我們就稱他Dave吧)通了電話。Dave告訴我說,現(xiàn)在公司上下都在對IT部門表示質(zhì)疑和憤怒??瓷先ノ覀兯坪踉诠ぷ鞯倪^程當(dāng)中忽視了某些對于員工來說至關(guān)重要的東西--NetWare服務(wù)器上的一套電子表格,這套電子表格是每個員工在處理訂單的時候都要用到的。我們在自我慶祝的時候絲毫都沒有想到,我們的用戶幾乎無法進(jìn)行他們的工作。
成功與失敗并存
這次經(jīng)歷讓我學(xué)到了很多重要的東西,使我對系統(tǒng)的恢復(fù)操作有了新的更深的認(rèn)識。這些認(rèn)識既來源于這次經(jīng)歷中的成功,也來自這次經(jīng)歷中的失敗。
首先,從積極的方面來看,我們在這次系統(tǒng)恢復(fù)過程當(dāng)中所采用的逐步恢復(fù)服務(wù)的計(jì)劃還是成功的,因?yàn)檫@樣確保了用戶可以首先獲得最基本的服務(wù)(登錄,打印和收發(fā)區(qū)域內(nèi)的電子郵件)。接下來,我們又恢復(fù)了我們認(rèn)為最重要的點(diǎn)對點(diǎn)的通訊交流。在用戶能夠進(jìn)行工作,客戶可以發(fā)送訂單后我們才開始全面恢復(fù)所有的服務(wù)內(nèi)容。
其次,我們的員工管理計(jì)劃進(jìn)行的非常成功。我們把IT小組的成員分成了兩個小組交替工作,每十二個小時換一次班,這樣既保證了恢復(fù)工作的不間斷進(jìn)行,又使員工們不會由于工作時間過長而感到疲勞,影響工作。我們還根據(jù)工作需要來調(diào)整不同崗位上的員工數(shù)量。剛開始只有一少部分的員工負(fù)責(zé)二級數(shù)據(jù)中心的工作,其他人都把精力放在了接電話,發(fā)布信息,處理服務(wù)層次上。隨著情況的不斷好轉(zhuǎn),我們逐步的把員工都轉(zhuǎn)移到了二級數(shù)據(jù)中心。
再次,我們的溝通戰(zhàn)略雖然事先沒有經(jīng)過演練,但卻以很高的效率完成了數(shù)據(jù)的發(fā)布。我們成功的利用了各種正式和非正式的渠道。即使是那些對我們的系統(tǒng)恢復(fù)工作不滿的用戶也不得不承認(rèn)我們的恢復(fù)過程的公開性和透明度。他們可以定期了解到關(guān)于系統(tǒng)恢復(fù)的即時信息,在這一點(diǎn)上對我們有足夠的信任。
不幸的是,并不是所有的事情都像我們希望的那樣成功,那樣順利。就拿我們分層次的步驟來說吧。我們成功的恢復(fù)了那些我們認(rèn)為重要的服務(wù)。但是,我們忽略了同用戶的溝通,沒有了解到對他們來說哪些服務(wù)是最重要的、是他們希望首先恢復(fù)的。有的時候,我們的猜測和判斷是正確的,但有的時候,也會出現(xiàn)錯誤。在有過了這次經(jīng)歷的教訓(xùn)之后,我明白了:既然用戶可以告訴我們他們認(rèn)為哪些服務(wù)的恢復(fù)是最重要的,我們?yōu)槭裁催€要去猜測呢?
我們向用戶發(fā)布的信息有的時候也是互相沖突的。我們?nèi)齻€負(fù)責(zé)人(我本人,電話中心的負(fù)責(zé)人和數(shù)據(jù)中心的負(fù)責(zé)人)在向用戶發(fā)布信息之前并不總是能夠確定我們發(fā)布的信息是同步的。我們本來可以指定我們?nèi)酥械囊蝗酥饕?fù)責(zé)信息的發(fā)布工作,或者可以把這個工作交給CIO。但是,CIO太忙了,由于問題不僅僅出現(xiàn)在數(shù)據(jù)中心,他還有很多別的事情需要去做,所以我們不想再給他增加負(fù)擔(dān)。
注意二級ERP
我們得到的另外一個教訓(xùn)是關(guān)于二級ERP的。我們把主要的精力放在了正式的ERP的恢復(fù)上。但是,大多數(shù)企業(yè)都有一個二級ERP,它由連接在一起的電子表格和桌面數(shù)據(jù)庫組成,對大量的日常工作進(jìn)行處理。我們公司的二級ERP是建立在一臺舊的、沒有保護(hù)的NetWare文檔服務(wù)器上的。盡管公司的章程通常不允許我們?yōu)槎塃RP提供正式的技術(shù)支持,但是有的時候,系統(tǒng)的恢復(fù)工作需要我們打破公司章程,以恢復(fù)二級ERP的商業(yè)功能。坦率的說,在問題發(fā)生之前,我們就應(yīng)該將一些共享成分轉(zhuǎn)移到我們可以提供支持的服務(wù)器上。
盡管隨著公司業(yè)務(wù)的不斷擴(kuò)展,在各種各樣的系統(tǒng)恢復(fù)過程中我又遇到過很多其他的問題(法律上的,操作上的,以及公司政策上的等等),但是有了這次經(jīng)歷中所獲得的經(jīng)驗(yàn)教訓(xùn),在系統(tǒng)恢復(fù)的過程中我始終保持著分層次處理的觀念,合理對員工進(jìn)行配置,迅速進(jìn)行協(xié)調(diào)溝通,并且從用戶而不是IT人員的角度出發(fā)。有了這些"法寶",遇到再麻煩的問題我都能夠從容妥當(dāng)?shù)奶幚砹?br>
作者: TechRepublic.com
【?發(fā)表評論?0條?】