hive sql有个比较强大的功能就是可以使用外界脚本来完成map/reduce。用法如下:
TRANSFORM(….) USING ‘….’ AS (….)。
USING里面可以使用php脚本来处理,具体使用方法看下面这个例子。
①、建一个表:
<code>hive> CREATE TABLE <span>`member`</span>( > <span>`id`</span><span>int</span>, > <span>`user_name`</span><span>string</span>, > <span>`passwd`</span><span>string</span> > ) > row <span>format</span> delimited > fields terminated by <span>"\t"</span><span>//这句很必要,不然下面的文件导入会导致所有的值都变成null </span> > stored as textfile;</code>
②、准备如下数据 /tmp/member.dat
<code>1 zhangsan zs1024 2 lisi ls1991 3 wangwu ww2001 4 liumang lm1234 5 linxing lx1990</code>
③、导入数据
<code>hive> <span>load</span> data <span>local</span> inpath <span>'/tmp/member.dat'</span> into <span>table</span> member;</code>
可以看到:
<code>hive> <span>select</span> * <span>from</span> member; OK <span>1</span> zhangsan zs1024 <span>2</span> lisi ls1991 <span>3</span> wangwu ww2001 <span>4</span> liumang lm1234 <span>5</span> linxing lx1990</code>
数据已经准备好了 ,现在我们相对第三列做一次md5加密。我们使用php脚本来处理,php脚本(/tmp/changePasswd.php)代码如下:
<code><span><span><?php </span><span>while</span>(!feof(STDIN)){ <span>$line</span> = rtrim(fgets(STDIN), <span>"\n"</span>); <span>//逐行读取</span><span>if</span> (<span>empty</span>(<span>$line</span>)) <span>continue</span>; <span>//空,跳出当次循环</span><span>$data</span> = explode(<span>"\t"</span>, <span>$line</span>); <span>//将切分出来的数组保存起来,下面判断使用</span><span>foreach</span>(<span>$data</span><span>as</span> &<span>$val</span>){ <span>$val</span> = md5(<span>$val</span>); } <span>unset</span>(<span>$val</span>); <span>echo</span> implode(<span>"\t"</span>, <span>$data</span>) . <span>"\n"</span>; }</span></span></code>
④、将php脚本加入到hive中。
<code>hive> <span>add</span> file /tmp/changePasswd<span>.php</span><span>;</span></code>
⑤、使用php脚本来执行map/reduce
<code>hive> insert overwrite table member > select TRANSFORM(<span>`i</span>d<span>`,</span><span>`u</span>ser_name<span>`,</span><span>`p</span>asswd<span>`)</span> using <span>"/usr/bin/php changePasswd.php"</span> > as (<span>`i</span>d<span>`,</span><span>`u</span>ser_name<span>`,</span><span>`p</span>asswd<span>`)</span> from member<span>;</span></code>
最后,我们可以看到,passwd那一列的数据已经改变:
<code>hive> <span>select</span> * <span>from</span> member; OK <span>1</span> zhangsan d03eed89429cc3006cc279322c2800c5 <span>2</span> lisi <span>063401506</span>c9d9f0e49a706e3779b7428 <span>3</span> wangwu ac5a8109dbbb46c9f69ffd5fc93c11f8 <span>4</span> liumang fda8b97fd723bdbf6a754812b5ecec27 <span>5</span> linxing <span>4035378</span>ace8936e93d95aa77e7e224d4</code>
版权声明:本文为博主原创文章,转载请注明出处。
以上就介绍了hive 使用php脚本来完成map/reduce,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。

php把负数转为正整数的方法:1、使用abs()函数将负数转为正数,使用intval()函数对正数取整,转为正整数,语法“intval(abs($number))”;2、利用“~”位运算符将负数取反加一,语法“~$number + 1”。

实现方法:1、使用“sleep(延迟秒数)”语句,可延迟执行函数若干秒;2、使用“time_nanosleep(延迟秒数,延迟纳秒数)”语句,可延迟执行函数若干秒和纳秒;3、使用“time_sleep_until(time()+7)”语句。

php字符串有下标。在PHP中,下标不仅可以应用于数组和对象,还可应用于字符串,利用字符串的下标和中括号“[]”可以访问指定索引位置的字符,并对该字符进行读写,语法“字符串名[下标值]”;字符串的下标值(索引值)只能是整数类型,起始值为0。

php除以100保留两位小数的方法:1、利用“/”运算符进行除法运算,语法“数值 / 100”;2、使用“number_format(除法结果, 2)”或“sprintf("%.2f",除法结果)”语句进行四舍五入的处理值,并保留两位小数。

在php中,可以使用substr()函数来读取字符串后几个字符,只需要将该函数的第二个参数设置为负值,第三个参数省略即可;语法为“substr(字符串,-n)”,表示读取从字符串结尾处向前数第n个字符开始,直到字符串结尾的全部字符。

判断方法:1、使用“strtotime("年-月-日")”语句将给定的年月日转换为时间戳格式;2、用“date("z",时间戳)+1”语句计算指定时间戳是一年的第几天。date()返回的天数是从0开始计算的,因此真实天数需要在此基础上加1。

方法:1、用“str_replace(" ","其他字符",$str)”语句,可将nbsp符替换为其他字符;2、用“preg_replace("/(\s|\ \;||\xc2\xa0)/","其他字符",$str)”语句。

查找方法:1、用strpos(),语法“strpos("字符串值","查找子串")+1”;2、用stripos(),语法“strpos("字符串值","查找子串")+1”。因为字符串是从0开始计数的,因此两个函数获取的位置需要进行加1处理。


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

SublimeText3汉化版
中文版,非常好用

MinGW - 适用于 Windows 的极简 GNU
这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

禅工作室 13.0.1
功能强大的PHP集成开发环境

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

WebStorm Mac版
好用的JavaScript开发工具