本篇透過閱讀《高擴充性網站的50條原則》,總結出以下內容。
一方面博主沒有實際的架構經驗,另一方面知識面也不夠寬闊,所以只能係統的總結書中的要點,並根據自己的理解做些歸納。
主要內容
本書從多個方面圍繞高擴展性提出了50條建議,一個高擴展性的網站會隨著業務的發展、用戶的增加,自由的擴展架構,從而輕鬆的應付網站的快速發展。以下來看看本書的具體內容:
化簡方程式
1 不要過度的設計
過度的設計相當於為系統增加了複雜度與維護的成本。而這些過度的設計,在正常的使用中,卻沒有太大的作用。往往是設計者自己認為很重要或是錦上添花的功能,實際用處不大。
2 設計時考慮到擴展性
在設計時要遵循一下的設計原則:設計時考慮20倍的容量,實現時考慮3倍的容量,部署時考慮1.5的容量。一面專案擴大時,臨時擴展所造成的困難。
3 把方案一簡再簡
應該遵循帕累託法則,20%的設計做了80%的工作,所以80%的時間,都應該放在這20%的設計上。
一個產品主要的功能其實都集中在幾個點上,把這幾個點設計好了,其他的都是些附加的功能而已。所以這核心的業務一定要確保足夠的簡潔易用。
4 減少DNS查詢
每個不同的網域下的文件,載入時都需要查詢DNS。例如cnblogs.com與i.cnblogs.com就屬於不同的網域。那麼在查詢DNS的時候,就會查詢兩次。當業務量很大時,就會造成一定的影響。
5 盡可能減少物件
由於物件在瀏覽器存取時,需要載入。所以可以考慮減少請求文件的數量(數量與瀏覽器並發加載數有關),把一些物件盡量的合併。例如圖標類的文件,可以合併成一個大的圖片。合理的文件數量,會加速瀏覽器的存取載入。
6 使用同一品牌的網路設備
由於一個http請求,可能透過很多實體設備。例如負載平衡器,交換機,路由器。所以盡量使用同一品牌的設備,會避免一些意外的狀況。
分佈工作
7 X軸,橫向複製
這種事最簡單的服務擴充,透過克隆或複製實現,例如你的應用程式放在多個伺服器上進行服務。常見的例如集群,負載平衡等等,資料庫的讀寫分離。
8 Y軸,分割不同的東西
大型系統中,分割不同的功能,例如註冊、購買、查詢、雲端盤。等等
9 Z軸,拆分不同的相似的東西
比如按照用戶的級別,或者用戶的地理位置等等拆分。
橫向擴展設計
10 設計橫向的擴展方案
擴展包括橫向、縱向。橫向就是透過複製克隆應用,利用小型機集群擴展。縱向就是提高伺服器的硬體以及網路設施。
透過許多的案例都可以發現,單純的升級硬體實現的縱向擴展,僅僅能解決一點點現實壓力。而透過橫向的集群擴展,卻能夠自由的實現伸縮。
11 採用經濟型系統
與上面的原則類似,採用高價格的伺服器,並不能保證日後的良好效能。應該使用普通的小型機集群擴展。
12 橫向擴充資料中心
資料中心有很多的設計方案,例如
熱冷站配置:使用熱站提供服務,當熱站崩潰時,使用冷站繼續服務。
建議使用多個即時站點,成本更低,動態呼叫。缺點是增加了維運的難度。
13 利用雲端技術進行設計
雲端運算的有點就是虛擬化,可以在業務高峰時,彈性的擴充設備。並且在日常處理用,歸還該擴充。
缺點是提高了應用於虛擬環境的耦合。後面提到利用實體設備,隔離業務,在虛擬化的雲端運算中,可能會對業務隔離錯誤排除造成一定的干擾。
使用正確的工具
14 合理使用資料庫
目前有許多的資料庫版本,例如傳統的關聯式資料庫Oracle、MySQl,以及記憶體較新的非關聯式資料庫NoqSql,例如MongoSql,例如MongoSql,例如MongoSql,例如MongoSql,例如MongoSql,例如MongoSql,例如MongoSql,例如MongoSql,例如MongoSql,例如還有專門針對SSD固態硬碟的Aerospike等等。
但是到了選型的時候,還是要一句個人的業務需求來定。看你的資料庫要求的是速度,還是安全性等等。
15 防火牆,到處都是防火牆
防火牆可以對一些無效的訪問進行攔截過濾。通常把一些CSS,靜態文件,圖片,JS等不採用防火牆,而關鍵的業務涉及個人資訊時採用。合理的設計防火牆,也會對網站的效能產生一定的影響。
16 積極的利用日誌檔案
利用各種日誌以及工具,即時的監控業務。不只是監控伺服器的記憶體CPU,還要監控業務上的資料。例如splunk(提供日誌的蒐集,存儲,搜索,圖形化展示)。
不要做重複的工作
17 不要立即檢查剛做過的工作
比如剛剛寫如了數據,不要立即讀取。雖然有些客戶需要保證資料的完整,不能遺失。但是可以透過日誌等記錄,寫完查這種做法,還是不推薦。
18 停止重定向
重定向會消耗一定的延遲,計算資源。應盡量避免
19 放鬆時序約束
大多數的關係型資料庫講究ACID屬性,擴充時就造成一定的困擾。因此某些業務適當的放鬆時序約束,可以提高網站的效能。
例如某站在預定飯店時,使用者預定後,會等待飯店的審核。例如某寶,在提款時,進行範圍時間的確認。這種就是擴大了時序約束,進而提升網站效能以及事務安全。
積極利用快取
20 利用CDN
可以利用CDN保存客戶的資料和內容。大概的過程是,用戶在進行網站訪問時,轉到CDN的伺服器,CDN執行DNS查詢,把用戶請求分攤到不同的伺服器。有很多的CDN服務商提供這種服務。
21 使用過期頭
針對不同的物件類型,使用過期頭,減少物件請求。常見的HTTP對應屬性為:public no-cahe max-age等等
22 快取Ajax呼叫
正確修改Http頭Last-Modified Cache-Control Expires等屬性。
23 利用頁面快取
快取回應之前的冬天請求,降低web伺服器的負載。
24 利用應用程式快取
例如針對某些特殊的用戶,快取其請求資料。
25 利用物件快取
適用於重複查詢使用的資料物件。例如一個購物網站,快取器熱銷產品資料。
26 把物件快取放在自己的層上
使用單獨的緩層,易於擴展和維護。
從錯誤中學習
27 正向的學習
一個公司有學習的氛圍,才會衍生出更好的產品。學習的內容一方麵包括客戶的業務知識,一方面來自技術和維運領域。
28 不要依靠QA發現失誤
僱用測試或品質保證人員,最大的目的是為了檢測產品的正確性。它能減少成本,提高開發人員的開發速度,因為開發人員不需要隨時注意程式碼的正確性,可以交給QA來測試。
但是QA只負責發現問題,如何避免為題還是得依靠開發人員。
29 沒有回退的設計是失敗的設計
這裡的回退,指的是產品發布的回退。如果碰到某些版本的BUG,可能需要交付先前可運行的版本,此時沒有回退,就無法交付產品了。
這裡推薦學習持續整合的相關內容。
30 討論失敗並從中吸取教訓
不應該在同一個問題上失敗兩次,每次失敗多進行總結是不可缺少的。
資料庫原則
關係型資料庫的ACID屬性:
原子性:一個事務要麼全執行,要麼都不執行,
〣〜性:事務的表現,是事務對資料庫唯一的操作,
持久性:事務完成,操作不能更改。
31 注意代價高的關係
應該在設計階段完善的設計表的結構,等開發開始時,在增加某些列,可能會花費很高的代價。
32 使用正確的資料庫鎖
資料庫有很多鎖的概念,例如隱式鎖、顯式鎖、行鎖、頁鎖、範圍鎖、表鎖、資料庫鎖等等。
不合理的使用鎖,會影響網站的吞吐量。
33 不要使用多階段提交
例如兩階段提交:先表決,在提交。這回降低擴展性,因為在其提交事務完成前,是不能作其他操作的。
34 不要使用select for update
因為FOR UPDATE子句會導致鎖定行,降低事務處理的速度。
35 不要選擇所有的資料
例如select * from xxx;
這種做法第一是不開與資料的擴充,例如本來有四列資料,業務處理程式碼直接寫死。當增加了一列資料時,就會導致出錯;另外就是會查詢出不必要的資料。
或inset into xxx values(xxxx);
這是當列資訊不符時,也會出錯。
容錯設計與故障控制
36 採用隔離故障的」泳道「
服務與資料的劃分有很多種,例如容器,集群,池,分片,泳道。泳道意味著每個業務都有自己的領域,不能跨泳道調用。
37 不要信任單點故障
有很多系統設計成單點模式,當整個系統只是用該模組時,當出現單點故障,整個系統也就崩潰了。
38 避免系統串聯
例如一個系統有很多的組件組成,每個組件99.9%的安全性,當串聯3個組件時,整個系統的可用性就變成了99.7%。
39 確保能夠啟用/停用功能
對於某些共享庫,第三方服務,應該提供開啟或關閉的功能。
避免或分發狀態
40 努力實現無狀態
實作狀態會限制擴充性,增大成本
41 盡可能在瀏覽器可以發送給任何的伺服器。
42 利用分散式快取存放狀態
使用獨立的快取層,利於擴充。有很多分散式的快取方案,例如memcached。
非同步通訊和訊息匯流排
43 盡可能使用非同步通訊
非同步通信,可以確保每個服務和層之間的獨立性,這樣易於早呢更加系統的擴展性和減小耦合度。
44 確保訊息總線能夠擴展
盡量採用Y軸或Z軸擴展,即按業務需求和功能擴展。因為單純的複製或克隆,反而會增加各個訊息訂閱者的監聽數目。依業務隔離,可以分離業務壓力。
45 避免讓訊息匯流排過度擁擠
衡量價值與訊息的成本。
其他原則
46 慎用第三方解決方案擴充
企業如果出現問題,那麼尋找第三方能夠解決燃眉之急。但卻不是長久之計,因為解決方案的提供者有很多客戶,你的危機並不是他們的危機,所以不可能在關鍵時刻,盡職盡責。因此企業還是應該有一定的掌控力(這個詞真是高大!)。
47 清除、歸檔和成本合理的存儲
有一些不必要的數據,就應該定期的刪除。一些略有價值的資料進行定期的歸檔直接刪除。一些很有價值的數據,應該進行備份以及快速存取。
48 刪除事務處理中的商業智慧
應該把產品系統與業務系統分離,提高產品的擴充性。
避免業務擴展時,受到系統架構的限制。
499 設計能夠監控的應用
應該設計全局的監控策略,保證回答
」發生了問題了嗎?「
」 」會發生問題嗎? “ ”能自動修復嗎? 一個簡單優秀的架構,都是小而精的,如果單純的依靠開源解決架構,雖然解決了問題,卻會導致應用的臃腫。