簡單說來,Web應用慢,是由于下面的三點原因造成的...
在當今本質上要求一直在線的Web運維環境中,基本上沒有時間用于計劃中的停機、維護以及其他影響網站可用性和產生收入的普通操作。本質上,沒有時間適合于停機,或適合于影響工作負荷,像例行備份、磁盤損壞、復制、軟件及固件升級等任務都不能干擾工作負荷,設計存儲基礎架構時,必須把這些因素考慮進去。 ...
存儲是很昂貴的,這是當今任何現代基礎架構中成本最高的組件。尤其是在數據密集的環境,存儲了大量用戶產生的內容以及數百萬的用戶數據。正是由于這個原因,對于存儲上的開支進行明智地規劃是很重要的。在我負責部署大規模存儲的時候,經手過大筆的預算,我學到了什么才是關鍵的問題,那就是對你所支持的應用程序為什么需要存儲、應用程序是如何使用存儲的、如何將存儲設計和實現得盡可能高效這些問題有明確、具體的了解。...
在確保有效的數據保護之后,作為一名存儲專業人員,容量規劃就是第二項最重要的職責。規劃在前,并且確保應用和服務有足夠的資源來運行和成長,不至于碰到天花板,這不僅是重要的,同時也是必需的。將容量和成長空間提前規劃為具有足夠的可伸縮性的好處是巨大的,不僅對你,對應用也一樣,都減小了壓力,既能應付應用上出現的非預期的爆炸性增長,也有助于避免資金的非計劃性支出。...
事后分析至少要包含這些內容...
對糾正措施必須進行追蹤,直到執行完成。要記住,在糾正措施沒有得到完全執行之前,事故重發的風險會一直存在。...
開始事后分析的時候,首先要做的事情就是明確基本規則,要明確告知參與事后分析的相關各方,事后分析不是指責誰,主要目的是為了使類似事件不再重復發生。快速發展的互聯網站,問題是不可避免的,重要的是我們能夠從錯誤中學到教訓。...
構建用于測量(圖示、裝備應用程序)和監控(報警)的系統是一項很值得做的事情,這些系統是基礎架構非常重要的核心內容,而且做起來也不是那么難。但據我所知,這些系統卻常常被忽略。如果沒有測量的話,很難對系統實現主動的管理。歷史的測量數據對于容量規劃和錯誤排查尤其有用。...
對于運維來說,對數據庫模式進行更新,是許多非常困難的任務之一。將數據庫模式與其他更新一起進行同步,有幾種常見的情景:部署、快速開發、通過修改索引和其他結構優化性能。假如模式更新是一種阻塞操作(MYSQL中通常就是這樣的),這就真的成問題了。...
對備份,只是希望在進入正式話題之前,允許給一些小提示。...