為回答“有問題嗎”這個問題提供必需數據的監控器,也為我們衡量是否創造了股東價值提供了關鍵數據。你也許還記得,以可用性作為一種指標。我們的目標是,對于問題“有問題嗎”,總是回答“沒有”。如果你能做到這一點, 就說明你具有很高的可用性。從客戶的角度和業務的角度來衡量可用性,而不是從技術的角度來衡量它,不僅給你提供了回答“有問題嗎”這個問題的工具,還可以拿你的可用性目標來衡量你自己。收人或客戶可用性與技術可用性之間的差別非常重要,它們會使組織的文化發生轉變,讓組織受益無窮。技術專家們長期以來用他們關心的所有設備的可用性的乘積作為長期衡量的可用性。這種可用性絕對有用武之地,就成本、兩次故障之間的平均時間、人員需求、冗余需求、存儲平均時間等方面的考慮來說,它們是很重要的。但它們與股東或客戶關心的東西并沒有什么直接聯系,股東和客戶最關心的是服務可用,并且服務能夠帶來最大可能的價值。因此,實時地衡量客戶體驗和產生的利潤對于回答我們的第一個也是最重要的一個監控問題以及衡量可用性,相對要有價值得多。只需少量的監控指標,我們就能衡量一個關鍵的管理指標,確保我們能識別出即將發生的事件和當前發生的事件并作出響應,從而使我們的文化與創造股東價值和客戶價值保持一致。
回答“哪里有問題”的監控指標,通常也能為我們的產能規劃和余量流程提供數據。這里的原始數據可以幫助我們確定我們的系統中哪里有約束,還會幫助我們把注意力放在水平擴展這些平臺的預算上,或者驅使我們改變架構,以便能夠更加經濟有效地擴展。顯然它們在故障和危機發生的過程中,非常有用,而在我們要找出如何盡早隔離這些故障或者如何避免這些故障再次發生的事后分析活動中,它們也是絕對有價值的。這些數據也可以作為性能測試流程的輸入,幫助我們改善這一流程。
用于回答“什么問題”的數據對在上一段提到的許多流程都很有用。此外,它還能幫助我們測試是否正確地把系統設計為能夠監控的了。軟件開發人員應該采用事后分析流程和運營評審流程輸出的數據,與我們監控生成的數據和信息進行對比,幫助我們發現和診斷問題。我們這樣做,是為了在代碼評審和設計評審流程中,使用這些信息,以便我們能創造出更好的、更加智能的監控方案,在問題發生之前就能發現它們,或者在它們發生時,能夠更快地把它們隔離起來。
在理想狀況下,如果我們采用了一個強大的、預測性很強的網站設計監控方案,那么我們就能預測故障和危機并避免它們,至少應該能夠在故障和危機開始引發客戶問題以及影響股東價值時,及時發現它們。在許多成熟的監控解決方案中,監控系統本身不僅要負責最先發現故障,還要報告或記錄這個故障。
本文地址:http://murenxiang.com.cn//article/3908.html