DDL(创建及删除表格) 如何在Hbase中创建表格以及删除表格。可通过Java和Hbase Shell两种方法实现。 创建表格 HBase中表格的创建是通过对操作HBaseAdmin这一对象使其调用createTable()这一方法来实现。 其中HTableDescriptor描述了表的schema,可在其上通过
DDL(创建及删除表格)
如何在Hbase中创建表格以及删除表格。可通过Java和Hbase Shell两种方法实现。
创建表格
HBase中表格的创建是通过对操作HBaseAdmin这一对象使其调用createTable()这一方法来实现。
其中HTableDescriptor描述了表的schema,可在其上通过addFamily()这一方法增加列族。
以下Java代码实现了建立一张简易的Hbase表格‘table1’,该表有两个列族,分别为f1和f2。
<code>public class createTable{ private static Configuration config; private static HBaseAdmin ha; public static void main(String[] args){ try{ config = HBaseConfiguration.create(); config.addResource("core-site.xml"); config.addResource("hdfs-site.xml"); config.addResource("yarn-site.xml"); config.addResource("mapred-site.xml"); ha = new HBaseAdmin(config); //create table descriptor String tableName = "table1"; HTableDescriptor htd = new HTableDescriptor(Bytes.toBytes(tableName)); //create and configure column families HColumnDescriptor hcd1 = new HColumnDescriptor(Bytes.toBytes("family1")); hcd1.setBlocksize(65536); hcd1.setMaxVersions(1); hcd1.setBloomFilterType(BloomType.ROW); hcd1.setCompressionType(Algorithm.SNAPPY); hcd1.setDataBlockEncoding(DataBlockEncoding.PREFIX); hcd1.setTimeToLive(36000); hcd1.setInMemory(false); HColumnDescriptor hcd2 = new HColumnDescriptor(Bytes.toBytes("family2")); hcd2.setBlocksize(65536); hcd2.setMaxVersions(1); hcd2.setBloomFilterType(BloomType.ROW); hcd2.setCompressionType(Algorithm.SNAPPY); hcd2.setDataBlockEncoding(DataBlockEncoding.PREFIX); hcd2.setTimeToLive(36000); hcd2.setInMemory(false); //add column families to table descriptor htd.addFamily(hcd1); htd.addFamily(hcd2); //create table ha.createTable(htd); System.out.println("Hbase table created."); }catch (TableExistsException e){ System.out.println("ERROR: attempting to create existing table!"); }catch (IOException e){ e.printStackTrace(); }finally{ try{ ha.close(); }catch(IOException e){ e.printStackTrace(); } } } } </code>
在Hbase Shell中,创建表格功能由create ‘Hbase表名’,[‘列族名’...]来实现。
例如,create ‘table1’,‘family1’,‘family2’同样可创建上述表格。
删除表格
删除表也是通过HBaseAdmin来操作,删除表之前首先要disable表。这是一个比较耗时的操作,所以不建议频繁删除表。
以下Java代码实现了对表格“table1”的删除操作:
<code>public class deleteTable{ private static Configuration config; private static HBaseAdmin ha; public static void main(String[] args){ try{ config = HBaseConfiguration.create(); config.addResource("core-site.xml"); config.addResource("hdfs-site.xml"); config.addResource("yarn-site.xml"); config.addResource("mapred-site.xml"); ha = new HBaseAdmin(config); String tableName = "table1"; //Only an existing table can be dropped if (ha.tableExists(tableName)){ //read&write denied ha.disableTable(tableName); ha.deleteTable(tableName); System.out.println("Hbase table dropped!"); } }catch(IOException e){ e.printStackTrace(); }finally{ try{ ha.close(); }catch(IOException e){ e.printStackTrace(); } } } } </code>
在Hbase Shell中,删除表格功能由drop ‘Hbase表名’来实现。
例如,先disable ‘table1’再drop ‘table1’同样可删除上述表格。
数据插入
在Java操作中,put方法被用做插入数据。
put方法可以传递单个Put对象: public void put(Put put) throws IOException,也可以对很多Put对象进行批量插入: public void put(List puts) throws IOException
以下Java代码实现了对表格"table1"的批量数据插入操作。插入数据后,表格有10000行,列族“family1”,“family2”中都包含“q1”,“q2”两个列,其中列族“family1”储存整型数据(int),列族“family2”储存字符串(string)。
ATTENTION:虽然Hbase支持多种类型储存,但为了应用高性能优化的hbase,表格值的储存类型建议一致使用为String。如上例所示,“family1:q1”中原为整数类型,须转制成string后再录入表中
<code>public class insertTable{ private static Configuration config; public static void main(String[] args) throws IOException{ config = HBaseConfiguration.create(); config.addResource("core-site.xml"); config.addResource("hdfs-site.xml"); config.addResource("yarn-site.xml"); config.addResource("mapred-site.xml"); String tableName = "table1"; HTable table = new HTable(config, tableName); //set AutoFlush table.setAutoFlush(true); int count = 10000; String familyName1 = "family1"; String familyName2 = "family2"; String qualifier1 = "q1"; String qualifier2 = "q2"; //data to be inserted String[] f1q1 = new String[count]; String[] f1q2 = new String[count]; String[] f2q1 = new String[count]; String[] f2q2 = new String[count]; for(int i = 0; i </code>
在Hbase Shell中,单条数据插入功能由put ‘Hbase表名’,‘rowKey’,‘列族名:列名’,‘数据值’来实现。
数据查询
Hbase表格的数据查询可分为单条查询与批量查询。
单条查询
单条查询是通过匹配rowkey在表格中查询某一行的数据。在Java中可通过get()这一方法来实现。
下列Java代码实现了在表格“table1”中取出指定rowkey一行的所有列的数据:
<code>public class getFromTable{ private static Configuration config; public static void main(String[] args) throws IOException{ String tableName = "table1"; config = HBaseConfiguration.create(); config.addResource("core-site.xml"); config.addResource("hdfs-site.xml"); config.addResource("yarn-site.xml"); config.addResource("mapred-site.xml"); HTable table = new HTable(config, tableName); Get get = new Get(Bytes.toBytes("Row01230")); //add target columns for get get.addColumn(Bytes.toBytes("family1"), Bytes.toBytes("q1")); get.addColumn(Bytes.toBytes("family1"), Bytes.toBytes("q2")); get.addColumn(Bytes.toBytes("family2"), Bytes.toBytes("q1")); get.addColumn(Bytes.toBytes("family2"), Bytes.toBytes("q2")); Result result = table.get(get); //get results byte[] rowKey = result.getRow(); byte[] val1 = result.getValue(Bytes.toBytes("family1"), Bytes.toBytes("q1")); byte[] val2 = result.getValue(Bytes.toBytes("family1"),Bytes.toBytes("q2")); byte[] val3 = result.getValue(Bytes.toBytes("family2"), Bytes.toBytes("q1")); byte[] val4 = result.getValue(Bytes.toBytes("family2"), Bytes.toBytes("q2")); System.out.println("Row key: " + Bytes.toString(rowKey)); System.out.println("value1: " + Bytes.toString(val1)); System.out.println("value2: " + Bytes.toString(val2)); System.out.println("value3: " + Bytes.toString(val3)); System.out.println("value4: " + Bytes.toString(val4)); table.close(); } } </code>
在Hbase Shell中,单条数据查找功能由get ‘Hbase表名’,‘rowKey’,‘列族名:列名’来实现。
批量查询
批量查询是通过制定一段rowkey的范围来查询。可通过Java中getScanner()这一方法来实现。
下列Java代码实现了在表格“table1”中取出指定一段rowkey范围的所有列的数据:
<code>public class scanFromTable { private static Configuration config; public static void main(String[] args) throws IOException{ config = HBaseConfiguration.create(); config.addResource("core-site.xml"); config.addResource("hdfs-site.xml"); config.addResource("yarn-site.xml"); config.addResource("mapred-site.xml"); String tableName = "table1"; HTable table = new HTable(config, tableName); //Scan according to rowkey range Scan scan = new Scan(); //set starting row(included), if not set, start from the first row scan.setStartRow(Bytes.toBytes("Row01000")); //set stopping row(excluded), if not set, stop at the last row scan.setStopRow(Bytes.toBytes("Row01100")); //specify columns to scan, if not specified, return all columns; scan.addColumn(Bytes.toBytes("family1"), Bytes.toBytes("q1")); scan.addColumn(Bytes.toBytes("family1"), Bytes.toBytes("q2")); scan.addColumn(Bytes.toBytes("family2"), Bytes.toBytes("q1")); scan.addColumn(Bytes.toBytes("family2"), Bytes.toBytes("q2")); //specify maximum versions for one cell, if called without arguments, get all versions, if not called, get only the latest version scan.setMaxVersions(); //specify maximum number of cells to avoid OutOfMemory error caused by huge amount of data in a single row scan.setBatch(10000); ResultScanner rs = table.getScanner(scan); for(Result r:rs){ byte[] rowKey = r.getRow(); byte[] val1 = r.getValue(Bytes.toBytes("family1"), Bytes.toBytes("q1")); byte[] val2 = r.getValue(Bytes.toBytes("family1"), Bytes.toBytes("q2")); byte[] val3 = r.getValue(Bytes.toBytes("family2"), Bytes.toBytes("q1")); byte[] val4 = r.getValue(Bytes.toBytes("family2"), Bytes.toBytes("q2")); System.out.print(Bytes.toString(rowKey)+": "); System.out.print(Bytes.toString(val1)+" "); System.out.print(Bytes.toString(val2)+" "); System.out.print(Bytes.toString(val3)+" "); System.out.println(Bytes.toString(val4)); } rs.close(); table.close(); } } </code>
在Hbase Shell中,批量数据查找功能由scan ‘Hbase表名’,{COLUMNS=>‘列族名:列名’,STARTROW=>‘起始rowkey’,STOPROW=>‘终止rowkey’}来实现。
利用过滤器筛选
过滤器是在Hbase服务器端上执行筛选操作,可以应用到行键(RowFilter),列限定符(QualifierFilter)以及数据值(ValueFilter)。
这里列举了两个常用的过滤器:RowFilter和SingleColumnValueFilter。
RowFilter
RowFilter通过行键(rowkey)来筛选数据。
其中BinaryComparator直接比较两个byte array,可选的比较符(CompareOp)有EQUAL,NOT_EQUAL,GREATER,GREATER_OR_EQUAL,LESS,LESS_OR_EQUAL。
<code>public class rowFilter{ public static void main(String[] args) throws IOException{ String tableName = "table1"; Configuration config = HBaseConfiguration.create(); config.addResource("core-site.xml"); config.addResource("hdfs-site.xml"); config.addResource("yarn-site.xml"); config.addResource("mapred-site.xml"); HTable table = new HTable(config, tableName); Scan scan = new Scan(); scan.addColumn(Bytes.toBytes("family1"), Bytes.toBytes("q1")); Filter filter = new RowFilter(CompareFilter.CompareOp.EQUAL, new BinaryComparator(Bytes.toBytes("Row01234"))); scan.setFilter(filter); ResultScanner scanner = table.getScanner(scan); for(Result res:scanner){ byte[] value = res.getValue(Bytes.toBytes("family1"),Bytes.toBytes("q1")); System.out.println(new String(res.getRow())+" value is: "+Bytes.toString(value)); } scanner.close(); table.close(); } } </code>
SingleColumnValueFilter
SingleColumnValueFilter对某一具体列的值进行筛选。
其中SubstringComparator检查给定的字符串是否是列值的子字符串,可选的比较符(CompareOp)有EQUAL和NOT_EQUAL。
<code>public class singleColumnValueFilter{ public static void main(String[] args) throws IOException{ Configuration config = HBaseConfiguration.create(); config.addResource("core-site.xml"); config.addResource("hdfs-site.xml"); config.addResource("yarn-site.xml"); config.addResource("mapred-site.xml"); String tableName = "table1"; HTable table = new HTable(config,tableName); SingleColumnValueFilter filter = new SingleColumnValueFilter( Bytes.toBytes("family2"), Bytes.toBytes("q1"), CompareFilter.CompareOp.NOT_EQUAL, new SubstringComparator("45")); //when setting setFilterIfMissing(true), rows with "null" values are filtered filter.setFilterIfMissing(true); Scan scan = new Scan(); scan.setFilter(filter); ResultScanner scanner = table.getScanner(scan); for (Result res:scanner){ byte[] val = res.getValue(Bytes.toBytes("family1"), Bytes.toBytes("q1")); System.out.println(new String(res.getRow())); System.out.println("value: " + Bytes.toString(val)); } scanner.close(); table.close(); } } </code>
原文地址:hbase Java API操作实例, 感谢原作者分享。

要優化MySQL慢查詢,需使用slowquerylog和performance_schema:1.啟用slowquerylog並設置閾值,記錄慢查詢;2.利用performance_schema分析查詢執行細節,找出性能瓶頸並優化。

MySQL和SQL是開發者必備技能。 1.MySQL是開源的關係型數據庫管理系統,SQL是用於管理和操作數據庫的標準語言。 2.MySQL通過高效的數據存儲和檢索功能支持多種存儲引擎,SQL通過簡單語句完成複雜數據操作。 3.使用示例包括基本查詢和高級查詢,如按條件過濾和排序。 4.常見錯誤包括語法錯誤和性能問題,可通過檢查SQL語句和使用EXPLAIN命令優化。 5.性能優化技巧包括使用索引、避免全表掃描、優化JOIN操作和提升代碼可讀性。

MySQL異步主從復制通過binlog實現數據同步,提升讀性能和高可用性。 1)主服務器記錄變更到binlog;2)從服務器通過I/O線程讀取binlog;3)從服務器的SQL線程應用binlog同步數據。

MySQL是一個開源的關係型數據庫管理系統。 1)創建數據庫和表:使用CREATEDATABASE和CREATETABLE命令。 2)基本操作:INSERT、UPDATE、DELETE和SELECT。 3)高級操作:JOIN、子查詢和事務處理。 4)調試技巧:檢查語法、數據類型和權限。 5)優化建議:使用索引、避免SELECT*和使用事務。

MySQL的安裝和基本操作包括:1.下載並安裝MySQL,設置根用戶密碼;2.使用SQL命令創建數據庫和表,如CREATEDATABASE和CREATETABLE;3.執行CRUD操作,使用INSERT,SELECT,UPDATE,DELETE命令;4.創建索引和存儲過程以優化性能和實現複雜邏輯。通過這些步驟,你可以從零開始構建和管理MySQL數據庫。

InnoDBBufferPool通過將數據和索引頁加載到內存中來提升MySQL數據庫的性能。 1)數據頁加載到BufferPool中,減少磁盤I/O。 2)臟頁被標記並定期刷新到磁盤。 3)LRU算法管理數據頁淘汰。 4)預讀機制提前加載可能需要的數據頁。

MySQL適合初學者使用,因為它安裝簡單、功能強大且易於管理數據。 1.安裝和配置簡單,適用於多種操作系統。 2.支持基本操作如創建數據庫和表、插入、查詢、更新和刪除數據。 3.提供高級功能如JOIN操作和子查詢。 4.可以通過索引、查詢優化和分錶分區來提升性能。 5.支持備份、恢復和安全措施,確保數據的安全和一致性。

全表掃描在MySQL中可能比使用索引更快,具體情況包括:1)數據量較小時;2)查詢返回大量數據時;3)索引列不具備高選擇性時;4)複雜查詢時。通過分析查詢計劃、優化索引、避免過度索引和定期維護表,可以在實際應用中做出最優選擇。


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

SublimeText3 Linux新版
SublimeText3 Linux最新版

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

SublimeText3漢化版
中文版,非常好用

Safe Exam Browser
Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。