對(duì)今天的IT解決方案來說,問題的結(jié)論考慮了該方案給用戶造成的影響。結(jié)論必須與有效跡象相一致。對(duì)反饋機(jī)制及日志的再調(diào)查對(duì)于判斷問題是否擴(kuò)大了以及擴(kuò)大的原因是什么至關(guān)重要。
在一個(gè)復(fù)雜的IT解決方案里,常常能看到多米諾效應(yīng),即諸如一個(gè)子系統(tǒng)這樣小的有缺陷的因素會(huì)激發(fā)一系列問題。如果不分析出事情進(jìn)展的精確信息,這可能會(huì)導(dǎo)致一次錯(cuò)誤的判斷――產(chǎn)生一次錯(cuò)誤的修補(bǔ)并且問題重新發(fā)生。只有找到問題的最根本原因并得以證實(shí)才算完成了判斷。
對(duì)一個(gè)IT解決方案來說,肯定手邊的證據(jù)以及詢問下面幾個(gè)問題非常重要。是否意識(shí)到IT解決方案會(huì)失敗?如果是的話,是否嘗試了一些(自動(dòng)化的)預(yù)防措施?它向人工或自動(dòng)化的操作員發(fā)出了警報(bào)嗎?反饋機(jī)制是否有問題并且提供了不可靠的數(shù)據(jù)?對(duì)問題的判斷準(zhǔn)確嗎?
泰坦尼克號(hào)的情況是緊急的,但還不到災(zāi)難性這一步。伊斯梅急于挽回顏面,他害怕白星公司的名聲受損,這使得周邊的環(huán)境很容易出錯(cuò)。泰坦尼克號(hào)安靜地靠在水下的冰架上,這使它看起來十分安穩(wěn)。也許細(xì)心一些他們就能以最小的損傷全身而退。伊斯梅倉(cāng)促行動(dòng)做出了草率的決定。第二搜索救援組(里面有造船人員和木匠)還來不及返回并給予評(píng)估。
今天的IT項(xiàng)目從中所獲取的經(jīng)驗(yàn)是:在解決問題時(shí),必須在搜集好所有數(shù)據(jù)信息的前提下,分析每個(gè)解決方案所帶來的風(fēng)險(xiǎn)性,再考慮選擇最合適的解決方案。要不然就得靠最后第四象限的修復(fù)階段了。在這個(gè)階段里,操作小組會(huì)根據(jù)服務(wù)級(jí)別協(xié)議(SLAs)即時(shí)撤回IT解決方案,并讓服務(wù)再重新開始。
就泰坦尼克號(hào)來說,不是所有采取的措施都是完全依據(jù)問題的解決方案。伊斯梅做出了致命的決定,給輪機(jī)艙打電話讓船向前開,想以最低速度來改變當(dāng)時(shí)的情況。輪機(jī)員后來證實(shí)輪船以3哩/小時(shí)的速度前行時(shí)曾發(fā)出過碾碎的聲音。
結(jié)論 今天,許多IT項(xiàng)目由于沒有作好周密準(zhǔn)備,導(dǎo)致流程不能很好地處理有關(guān)平均修復(fù)時(shí)間(MTTR)時(shí)鐘的問題,因而項(xiàng)目在操作階段受到了嚴(yán)重的損傷。一個(gè)流程對(duì)于操作小組來說意義重大,因?yàn)樗苁剐〗M快速恢復(fù)服務(wù)并維持服務(wù)水平。一個(gè)流程也應(yīng)具有部門之間的相互制衡機(jī)制(通過審核),以此來最小化在一個(gè)有壓力的環(huán)境下出錯(cuò)的可能性。一個(gè)流程應(yīng)該列出每個(gè)人承擔(dān)的責(zé)任和扮演的角色,以此確保合適的人去制定合適的決策。
此文章共有2頁 上一頁 1 2
文章來源:中國(guó)項(xiàng)目管理資源網(wǎng)
|