搜尋
首頁資料庫mysql教程資料從mysql遷移到hbase的一些思考及設計

一、進行遷移的原因

由於業務的發展,使用mysql進行建立索引進行搜尋已經造成資料流的瓶頸卡在了資料庫io,例如每次dump全表的時候,會造成壓力過大,造成耗時很長,而且目前的資料量基本上已經達到了億級的資料量,如果希望mysql能更好的提供服務,下一步必須考慮分庫分錶才可以;基於這種情況下,考慮使用hbase用來進行資料的存儲,因為hbase所能承受的資料量遠大於mysql,而且對列的擴展也很方便

二、關係型資料庫與Nosql的一些區別

(1)儲存方式的區別

在類似mysql,sqlserver,oracle等關係型資料庫,資料的儲存是按照行進行儲存的,如下圖所示:


但是在hbase裡面,所有的資料都是基於列進行儲存的,如下所示:


其中hbase的邏輯模型如下圖所示:


其中:com.cnn.ww對應的是rowkey,相當於mysql的主鍵的概念

contents,anchor:這兩個對應的是列族的概念,在物理的儲存上,同一個列族的資料儲存在相同檔案

cnnsi.com,mylook.ca:對應的是列族下面的列,在hbase中列是可以動態增加的

對應的方格數據表示的是單元數據,即對應rowkey,cf:column下面的具體的值

其中tn:表示的是時間戳,單元資料的不同版本

其中有一張儲存結構如下:



(2)CRUD一些差異

CRUD是資料庫的最基本也是最常用的操作,在hbase裡面也有對應的指令,例如建表語句對於mysql的在此不詳述,對於hbase shell的如下所示

create 'table','columnfamily'

#即可以建立一個名為table,列族為columnfamily的表,其他的一些blocksize,version資料為默認

讀取資料的時候,在hbase語句如:get 'table','row','cf:column'即可得到對應的資料

更新資料的時候,在hbase中沒有對應更新的概念,只是會有一個新的版本,從時間戳上可以體現出來,所用的語句為

put 'table','row','cf:name','value '

即可將value的值賦給對應cf列族,name的列

刪除資料的區別,在mysql中刪除資料只能是直接刪除一行,或是將某一列置為空,在hbase裡面可以直接刪除某一列

(3)索引的區別

在mysql中可以建立索引,或是過濾查詢,但是在hbase中,只支援依照rowkey進行查詢速率最快

(4)從mysql到nosql的發展的思考

關係型資料庫的歷史已經很久,但是當資料量膨脹之後,例如對於mysql資料庫,當資料量為上億或更多的時候,如果按照索引進行查詢,可能效果也不是特別的明顯,最後只能按照主鍵進行查詢,或者逐漸發展為分庫分錶的模式,但是分庫分錶又給運維以及使用帶來了很大的麻煩;於是這個時候,nosql資料庫主鍵發展,nosql簡稱not only sql,是在資料量暴增的當前逐漸發展壯大起來,以nosql裡面的hbase作為例子,支持TB以及PB的數據,並且列的擴充特別的彈性

(5)hbase為什麼可以儲存海量的資料呢

其實hbase可以看做是mysql分庫分錶後的結果,只是不同的是mysql分庫分表後支援索引等,但是對於hbase僅支援rowkey作為主鍵索引,從書中可以知道,hbase的資料是按照列進行儲存的,並且當資料過大的時候,會按照行進行分裂,如下如所示:



把不同的region放到了不同的機器,並且最後還有master進行管理,即相當於對行列進行了一個劃分,從而儲存大量的資料

三、資料遷移遇到的一些問題

(1)聯合索引的問題

在mysql會有一些聯合索引的情況,例如存在一個商品與分類對應關係的表,需要得到某一個商品的所有分類,也希望可以得到某一個分類的所有商品,在mysql中直接按照聯合索引可以達到要求,但是在hbase的時候只能按照rowkey查詢如何辦呢

經過閱讀相關的資料得到有以下兩種的解決方法

1、建立寬表

在hbase中,允許行跟行之間的列是不同的,只要有共同的列族即可,那麼對於上述的情況,可以建立一個按照分類為rowkey的寬表,如下所示

分類id ,作為rowkey

product_id,作為列名字

value儲存為是否刪除


##上述即可rowkey為分類id ,可以直接從row得到所有的product_id,然後自己過濾是否刪除

2、建立高表

什麼是建立高表呢,也就是說不需要那麼多的列,只是儲存多行,因為在hbase裡面是按照字典順序排序的,因此可以進行如下的設計

分類id_商品id,作為rowkey


##只要scan以1開頭的行,就可以得到所有的資料

上述兩種辦法從本質上來說,都是建構了一個二級索引來儲存資料


# 以上就是資料從mysql遷移到hbase的一些思考及設計的內容,更多相關內容請關注PHP中文網(www.php. cn)!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
MySQL:世界上最受歡迎的數據庫的簡介MySQL:世界上最受歡迎的數據庫的簡介Apr 12, 2025 am 12:18 AM

MySQL是一種開源的關係型數據庫管理系統,主要用於快速、可靠地存儲和檢索數據。其工作原理包括客戶端請求、查詢解析、執行查詢和返回結果。使用示例包括創建表、插入和查詢數據,以及高級功能如JOIN操作。常見錯誤涉及SQL語法、數據類型和權限問題,優化建議包括使用索引、優化查詢和分錶分區。

MySQL的重要性:數據存儲和管理MySQL的重要性:數據存儲和管理Apr 12, 2025 am 12:18 AM

MySQL是一個開源的關係型數據庫管理系統,適用於數據存儲、管理、查詢和安全。 1.它支持多種操作系統,廣泛應用於Web應用等領域。 2.通過客戶端-服務器架構和不同存儲引擎,MySQL高效處理數據。 3.基本用法包括創建數據庫和表,插入、查詢和更新數據。 4.高級用法涉及復雜查詢和存儲過程。 5.常見錯誤可通過EXPLAIN語句調試。 6.性能優化包括合理使用索引和優化查詢語句。

為什麼要使用mysql?利益和優勢為什麼要使用mysql?利益和優勢Apr 12, 2025 am 12:17 AM

選擇MySQL的原因是其性能、可靠性、易用性和社區支持。 1.MySQL提供高效的數據存儲和檢索功能,支持多種數據類型和高級查詢操作。 2.採用客戶端-服務器架構和多種存儲引擎,支持事務和查詢優化。 3.易於使用,支持多種操作系統和編程語言。 4.擁有強大的社區支持,提供豐富的資源和解決方案。

描述InnoDB鎖定機制(共享鎖,獨家鎖,意向鎖,記錄鎖,間隙鎖,下一鍵鎖)。描述InnoDB鎖定機制(共享鎖,獨家鎖,意向鎖,記錄鎖,間隙鎖,下一鍵鎖)。Apr 12, 2025 am 12:16 AM

InnoDB的鎖機制包括共享鎖、排他鎖、意向鎖、記錄鎖、間隙鎖和下一個鍵鎖。 1.共享鎖允許事務讀取數據而不阻止其他事務讀取。 2.排他鎖阻止其他事務讀取和修改數據。 3.意向鎖優化鎖效率。 4.記錄鎖鎖定索引記錄。 5.間隙鎖鎖定索引記錄間隙。 6.下一個鍵鎖是記錄鎖和間隙鎖的組合,確保數據一致性。

MySQL查詢性能差的常見原因是什麼?MySQL查詢性能差的常見原因是什麼?Apr 12, 2025 am 12:11 AM

MySQL查询性能不佳的原因主要包括没有使用索引、查询优化器选择错误的执行计划、表设计不合理、数据量过大和锁竞争。1.没有索引导致查询缓慢,添加索引后可显著提升性能。2.使用EXPLAIN命令可以分析查询计划,找出优化器错误。3.重构表结构和优化JOIN条件可改善表设计问题。4.数据量大时,采用分区和分表策略。5.高并发环境下,优化事务和锁策略可减少锁竞争。

您什麼時候應該使用複合索引與多個單列索引?您什麼時候應該使用複合索引與多個單列索引?Apr 11, 2025 am 12:06 AM

在數據庫優化中,應根據查詢需求選擇索引策略:1.當查詢涉及多個列且條件順序固定時,使用複合索引;2.當查詢涉及多個列但條件順序不固定時,使用多個單列索引。複合索引適用於優化多列查詢,單列索引則適合單列查詢。

如何識別和優化MySQL中的慢速查詢? (慢查詢日誌,performance_schema)如何識別和優化MySQL中的慢速查詢? (慢查詢日誌,performance_schema)Apr 10, 2025 am 09:36 AM

要優化MySQL慢查詢,需使用slowquerylog和performance_schema:1.啟用slowquerylog並設置閾值,記錄慢查詢;2.利用performance_schema分析查詢執行細節,找出性能瓶頸並優化。

MySQL和SQL:開發人員的基本技能MySQL和SQL:開發人員的基本技能Apr 10, 2025 am 09:30 AM

MySQL和SQL是開發者必備技能。 1.MySQL是開源的關係型數據庫管理系統,SQL是用於管理和操作數據庫的標準語言。 2.MySQL通過高效的數據存儲和檢索功能支持多種存儲引擎,SQL通過簡單語句完成複雜數據操作。 3.使用示例包括基本查詢和高級查詢,如按條件過濾和排序。 4.常見錯誤包括語法錯誤和性能問題,可通過檢查SQL語句和使用EXPLAIN命令優化。 5.性能優化技巧包括使用索引、避免全表掃描、優化JOIN操作和提升代碼可讀性。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。