對今天的IT解決方案來說,問題的結(jié)論考慮了該方案給用戶造成的影響。結(jié)論必須與有效跡象相一致。對反饋機制及日志的再調(diào)查對于判斷問題是否擴大了以及擴大的原因是什么至關(guān)重要。
在一個復雜的IT解決方案里,常常能看到多米諾效應(yīng),即諸如一個子系統(tǒng)這樣小的有缺陷的因素會激發(fā)一系列問題。如果不分析出事情進展的精確信息,這可能會導致一次錯誤的判斷――產(chǎn)生一次錯誤的修補并且問題重新發(fā)生。只有找到問題的最根本原因并得以證實才算完成了判斷。
對一個IT解決方案來說,肯定手邊的證據(jù)以及詢問下面幾個問題非常重要。是否意識到IT解決方案會失?如果是的話,是否嘗試了一些(自動化的)預(yù)防措施?它向人工或自動化的操作員發(fā)出了警報嗎?反饋機制是否有問題并且提供了不可靠的數(shù)據(jù)?對問題的判斷準確嗎?
泰坦尼克號的情況是緊急的,但還不到災(zāi)難性這一步。伊斯梅急于挽回顏面,他害怕白星公司的名聲受損,這使得周邊的環(huán)境很容易出錯。泰坦尼克號安靜地靠在水下的冰架上,這使它看起來十分安穩(wěn)。也許細心一些他們就能以最小的損傷全身而退。伊斯梅倉促行動做出了草率的決定。第二搜索救援組(里面有造船人員和木匠)還來不及返回并給予評估。
今天的IT項目從中所獲取的經(jīng)驗是:在解決問題時,必須在搜集好所有數(shù)據(jù)信息的前提下,分析每個解決方案所帶來的風險性,再考慮選擇最合適的解決方案。要不然就得靠最后第四象限的修復階段了。在這個階段里,操作小組會根據(jù)服務(wù)級別協(xié)議(SLAs)即時撤回IT解決方案,并讓服務(wù)再重新開始。
就泰坦尼克號來說,不是所有采取的措施都是完全依據(jù)問題的解決方案。伊斯梅做出了致命的決定,給輪機艙打電話讓船向前開,想以最低速度來改變當時的情況。輪機員后來證實輪船以3哩/小時的速度前行時曾發(fā)出過碾碎的聲音。
結(jié)論 今天,許多IT項目由于沒有作好周密準備,導致流程不能很好地處理有關(guān)平均修復時間(MTTR)時鐘的問題,因而項目在操作階段受到了嚴重的損傷。一個流程對于操作小組來說意義重大,因為它能使小組快速恢復服務(wù)并維持服務(wù)水平。一個流程也應(yīng)具有部門之間的相互制衡機制(通過審核),以此來最小化在一個有壓力的環(huán)境下出錯的可能性。一個流程應(yīng)該列出每個人承擔的責任和扮演的角色,以此確保合適的人去制定合適的決策。
此文章共有2頁 上一頁 1 2
文章來源:中國項目管理資源網(wǎng)
|