MR中Hbase的Scan使用技巧-mysql教程-PHP中文網

首頁

資料庫

mysql教程

MR中Hbase的Scan使用技巧

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 04:30 PM

hadoophbasescan使用技巧運算

Hadoop的MR运算中，Hbase可以作为输入数据源参与运算，其中作为HTable的迭代器Scan有几个使用技巧涉及的方法如下： public void setBatch(int batch)public void setCaching(int caching)public void setCacheBlocks(boolean cacheBlocks) public void setB

Hadoop的MR运算中，Hbase可以作为输入数据源参与运算，其中作为HTable的迭代器Scan有几个使用技巧

涉及的方法如下：

public void setBatch(int batch)
public void setCaching(int caching)
public void setCacheBlocks(boolean cacheBlocks)

public void setBatch(int batch) ：

为设置获取记录的列个数，默认无限制，也就是返回所有的列

public void setCaching(int caching)：

每次从服务器端读取的行数，默认为配置文件中设置的值

public void setCacheBlocks(boolean cacheBlocks)：

为是否缓存块，默认缓存，我们分内存，缓存和磁盘，三种方式，一般数据的读取为内存->缓存->磁盘，当MR的时候为非热点数据，因此不需要缓存

因此在MR的时候最好设置如下：

scan.setCacheBlocks(false);
scan.setCaching(200);//大了占内存，但是rpc少
scan.setBatch(6);//你需要的列

已有 0 人发表留言，猛击->> 这里

ITeye推荐

—软件人才免语言低担保赴美带薪读研！—

MR中Hbase的Scan使用技巧

原文地址：MR中Hbase的Scan使用技巧, 感谢原作者分享。

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

如何使用 Go 语言进行量化金融分析？Jun 11, 2023 am 08:51 AM

在现代金融领域中，随着数据科学和人工智能技术的兴起，量化金融逐渐成为了越来越重要的一个方向。而作为一门能够高效处理数据和部署分布式系统的静态类型编程语言，Go语言也逐渐受到了量化金融领域的关注。本文将介绍如何使用Go语言进行量化金融分析，具体内容如下：获取金融数据首先，我们需要获取金融数据。Go语言的网络编程能力非常强大，可以用来获取各种金融数据。比

如何使用 Go 语言进行数据挖掘？Jun 10, 2023 am 08:39 AM

随着大数据和数据挖掘的兴起，越来越多的编程语言开始支持数据挖掘的功能。Go语言作为一种快速、安全、高效的编程语言，也可以用于数据挖掘。那么，如何使用Go语言进行数据挖掘呢？以下是一些重要的步骤和技术。数据获取首先，你需要获取数据。这可以通过各种途径实现，比如爬取网页上的信息、使用API获取数据、从数据库中读取数据等等。Go语言自带了丰富的HTTP

如何使用nginx进行防盗链Jun 11, 2023 pm 01:25 PM

随着互联网的普及，越来越多的网站提供了图片、视频等资源的外链功能。然而，这种外链功能却容易被盗链。盗链是指其它网站利用你网站上的图片、视频等资源，直接通过引用地址在自己的网站显示这些资源，而不是将其下载到自己的服务器上。这样一来，盗链网站就可以免费使用你网站的流量和带宽资源，这既浪费资源又影响网站速度。针对这种问题，可以使用Nginx进行防盗链。Nginx是

在Beego中使用Hadoop和HBase进行大数据存储和查询Jun 22, 2023 am 10:21 AM

随着大数据时代的到来，数据处理和存储变得越来越重要，如何高效地管理和分析大量的数据也成为企业面临的挑战。Hadoop和HBase作为Apache基金会的两个项目，为大数据存储和分析提供了一种解决方案。本文将介绍如何在Beego中使用Hadoop和HBase进行大数据存储和查询。一、Hadoop和HBase简介Hadoop是一个开源的分布式存储和计算系统，它可

如何在ThinkPHP6中使用友好的URL地址？Jun 12, 2023 am 08:52 AM

随着互联网的发展，越来越多的网站需要考虑优化用户体验，其中一个方面就是友好的URL地址。ThinkPHP是一款优秀的PHP框架，对于URL地址的处理也提供了便捷的解决方案。本文将介绍如何在ThinkPHP6中使用友好的URL地址。首先，我们需要了解下ThinkPHP6中关于路由的相关概念。路由是指将URL请求转发到指定的控制器和方法

如何使用Python正则表达式进行单词分割Jun 23, 2023 am 10:37 AM

Python正则表达式是一种强大的工具，可用于处理文本数据。在自然语言处理中，单词分割是一个重要的任务，它可以将一段文本分成单个单词。在Python中，我们可以使用正则表达式来完成单词分割的任务。下面将以Python3为例，介绍如何使用正则表达式进行单词分割。导入re模块re模块是Python内置的正则表达式模块，首先需要导入该模块。importre定义文

如何在PHP中使用腾讯云API接口May 21, 2023 am 08:10 AM

随着云计算的普及，越来越多的开发者开始选择将自己的应用部署到云上。在这其中，腾讯云作为国内领先的云服务提供商，受到了越来越多开发者的青睐。腾讯云提供了众多的API接口，方便开发者在自己的应用中使用。本文将介绍如何在PHP中使用腾讯云API接口。一、腾讯云API密钥在使用腾讯云API接口之前，首先需要获取API密钥。API密钥由SecretId和SecretK

如何使用Linux命令行工具分析应用程序日志？Jul 29, 2023 pm 03:29 PM

如何使用Linux命令行工具分析应用程序日志？随着应用程序的不断发展，日志记录成为了一种重要的追踪和调试工具。对于开发人员和系统管理员来说，分析应用程序日志是定位和解决问题的基础。本文将介绍如何使用Linux命令行工具来分析应用程序日志，并提供一些常用的代码示例。首先，我们需要了解Linux操作系统提供的一些常用的命令行工具。tail命令：用于查看日志文件的

See all articles