Hadoop的MR运算中,Hbase可以作为输入数据源参与运算,其中作为HTable的迭代器Scan有几个使用技巧 涉及的方法如下: public void setBatch(int batch)public void setCaching(int caching)public void setCacheBlocks(boolean cacheBlocks) public void setB
Hadoop的MR运算中,Hbase可以作为输入数据源参与运算,其中作为HTable的迭代器Scan有几个使用技巧
涉及的方法如下:
public void setBatch(int batch) public void setCaching(int caching) public void setCacheBlocks(boolean cacheBlocks)
public void setBatch(int batch) :
为设置获取记录的列个数,默认无限制,也就是返回所有的列
public void setCaching(int caching):
每次从服务器端读取的行数,默认为配置文件中设置的值
public void setCacheBlocks(boolean cacheBlocks):
为是否缓存块,默认缓存,我们分内存,缓存和磁盘,三种方式,一般数据的读取为内存->缓存->磁盘,当MR的时候为非热点数据,因此不需要缓存
因此在MR的时候最好设置如下:
scan.setCacheBlocks(false); scan.setCaching(200);//大了占内存,但是rpc少 scan.setBatch(6);//你需要的列
?
已有 0 人发表留言,猛击->> 这里
ITeye推荐
- —软件人才免语言低担保 赴美带薪读研!—
原文地址:MR中Hbase的Scan使用技巧, 感谢原作者分享。

在现代金融领域中,随着数据科学和人工智能技术的兴起,量化金融逐渐成为了越来越重要的一个方向。而作为一门能够高效处理数据和部署分布式系统的静态类型编程语言,Go语言也逐渐受到了量化金融领域的关注。本文将介绍如何使用Go语言进行量化金融分析,具体内容如下:获取金融数据首先,我们需要获取金融数据。Go语言的网络编程能力非常强大,可以用来获取各种金融数据。比

随着大数据和数据挖掘的兴起,越来越多的编程语言开始支持数据挖掘的功能。Go语言作为一种快速、安全、高效的编程语言,也可以用于数据挖掘。那么,如何使用Go语言进行数据挖掘呢?以下是一些重要的步骤和技术。数据获取首先,你需要获取数据。这可以通过各种途径实现,比如爬取网页上的信息、使用API获取数据、从数据库中读取数据等等。Go语言自带了丰富的HTTP

随着互联网的普及,越来越多的网站提供了图片、视频等资源的外链功能。然而,这种外链功能却容易被盗链。盗链是指其它网站利用你网站上的图片、视频等资源,直接通过引用地址在自己的网站显示这些资源,而不是将其下载到自己的服务器上。这样一来,盗链网站就可以免费使用你网站的流量和带宽资源,这既浪费资源又影响网站速度。针对这种问题,可以使用Nginx进行防盗链。Nginx是

随着大数据时代的到来,数据处理和存储变得越来越重要,如何高效地管理和分析大量的数据也成为企业面临的挑战。Hadoop和HBase作为Apache基金会的两个项目,为大数据存储和分析提供了一种解决方案。本文将介绍如何在Beego中使用Hadoop和HBase进行大数据存储和查询。一、Hadoop和HBase简介Hadoop是一个开源的分布式存储和计算系统,它可

随着互联网的发展,越来越多的网站需要考虑优化用户体验,其中一个方面就是友好的URL地址。ThinkPHP是一款优秀的PHP框架,对于URL地址的处理也提供了便捷的解决方案。本文将介绍如何在ThinkPHP6中使用友好的URL地址。首先,我们需要了解下ThinkPHP6中关于路由的相关概念。路由是指将URL请求转发到指定的控制器和方法

Python正则表达式是一种强大的工具,可用于处理文本数据。在自然语言处理中,单词分割是一个重要的任务,它可以将一段文本分成单个单词。在Python中,我们可以使用正则表达式来完成单词分割的任务。下面将以Python3为例,介绍如何使用正则表达式进行单词分割。导入re模块re模块是Python内置的正则表达式模块,首先需要导入该模块。importre定义文

随着云计算的普及,越来越多的开发者开始选择将自己的应用部署到云上。在这其中,腾讯云作为国内领先的云服务提供商,受到了越来越多开发者的青睐。腾讯云提供了众多的API接口,方便开发者在自己的应用中使用。本文将介绍如何在PHP中使用腾讯云API接口。一、腾讯云API密钥在使用腾讯云API接口之前,首先需要获取API密钥。API密钥由SecretId和SecretK

如何使用Linux命令行工具分析应用程序日志?随着应用程序的不断发展,日志记录成为了一种重要的追踪和调试工具。对于开发人员和系统管理员来说,分析应用程序日志是定位和解决问题的基础。本文将介绍如何使用Linux命令行工具来分析应用程序日志,并提供一些常用的代码示例。首先,我们需要了解Linux操作系统提供的一些常用的命令行工具。tail命令:用于查看日志文件的


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

SublimeText3 英文版
推薦:為Win版本,支援程式碼提示!

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

Atom編輯器mac版下載
最受歡迎的的開源編輯器

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)