sharding - 資料庫分庫切表後Java後端程式碼實作以及最佳實踐

Question

現在業務中由於一些表越來越大，read的時候壓力很大（write的需求比較小），所以在資料庫端決定把一些資料量特別大的表切表， 但是在後端程式碼中有很多程式碼/query需要做join這些表，請問這樣的情況下大家是怎麼樣...

大家讲道理 · Answer

可以考慮引入資料庫中間件
sharding-jdbc client等級
mycat-server server等級

世界只因有你 · Answer

朋友介紹 Spark 不錯，支援 SQl 式的查詢，1 億個資料約 0.5 秒返回結果

ringa_lee · Answer

只針對目前我們專案中的情況：在分錶時根據hash演算法落到特定表，然後取的時候先根據演算法取得資料的分佈位置，然後就是正常的select了

漂亮男人 · Answer

不建議連表查詢
1.資料庫資源比較寶貴，連表查詢會佔用大量的內存，導致資料庫效能下降
2.不支援資料在多個資料庫實例，分庫情況無法處理，擴充性較差

通用做法是將連表查詢，查分成多個單表查詢，然後將結果加總。
1.能夠上述連表查詢的問題
2.多次查詢也可以在程式中對每一次查詢的中間結果做處理，這是一個靈活性。
3.應用程式也可以隨時擴展，更有彈性

如果是離線場景，建議使用MR(mapreduce)框架來處理，例如：hadoop等，對應的，需要將資料寫入hdfs上。

欧阳克 · Answer

http://blog.csdn.net/tianyale...
詳解分庫分錶