搜尋
首頁常見問題hive內建函數是什麼

hive內建函數是什麼

Feb 26, 2021 pm 12:02 PM
hive內建函數

hive內建函數:1、使用者自訂函數對資料進行處理;2、用來解決輸入一行輸出多行【(On-to-many maping)】的需求;3.使用者自訂聚合函數,操作多個資料行,產生一個資料行。

hive內建函數是什麼

本文操作環境:Windows7系統,Dell G3電腦。

hive內建函數:

定義:

UDF(User-Defined-Function),使用者自訂函數對數據進行處理。

UDTF(User-Defined Table-Generating Functions) 用來解決 輸入一行輸出多行(On-to-many maping) 的需求。

UDAF(User Defined Aggregation Function)使用者自訂聚合函數,操作多個資料行,產生一個資料行。

用法:

  1、UDF函數可以直接套用於select語句,對查詢結構做格式化處理後,再輸出內容。

  2、寫UDF函數的時候需要注意一下幾點:

a)自訂UDF需要繼承org.apache.hadoop.hive.ql.UDF

b)需要實作evaluate函。

c)evaluate函數支援重載。

hive的本地模式:

  大多數的Hadoop job是需要hadoop提供的完整的可擴展性來處理大數據的。不過,有時hive的輸入資料量是非常小的。在這種情況下,為查詢出發執行任務的時間消耗可能會比實際job的執行時間要多的多。對於大多數這種情況,hive可以透過本機模式在單一機器上處理所有的任務。對於小資料集,執行時間會明顯縮短。

  如此一來,對資料量比較小的操作,就可以在本地執行,這樣要比提交任務到叢集執行效率要快很多。

  配置如下參數,可以開啟Hive的本地模式:

hive> set hive.exec.mode.local.auto=true;(默认为false)

hive內建函數是什麼

當一個job滿足如下條件才能真正使用本地模式:

    1.job的輸入資料大小必須小於參數:hive.exec.mode.local.auto.inputbytes.max(預設128MB)

#    2.job的map數必定小於參數: .local.auto.tasks.max(預設4)

    3.job的reduce數必須為0或1

相關免費學習推薦:php程式設計(影片)

#

以上是hive內建函數是什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱工具

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具