hive新增自定義函式

阿新 • • 發佈：2021-06-19

hive新增自定義函式方式有兩種，一種是繼承UDF ，另一種繼承GenericUDF

UDF開發較為方便，先新版本中已被棄用，建議使用GenericUDF org.apache.hadoop.hive.ql.exec.UDF

GenericUDF開發更加靈活，但也增加了複雜成本 org.apache.hadoop.hive.ql.udf.generic.GenericUDF

以下以，UDF開發演示自定義函式的，整體過程：

1.新建maven工程,新增如下依賴

<dependency>
    <groupId>org.apache.hive</groupId> 

    <artifactId>hive-exec</artifactId>
    <version>3.1.2</version>
</dependency>

如新增判斷是否為空自定義函式,程式碼如下:

package com.bigdata.hive.udf;
import org.apache.hadoop.hive.ql.exec.Description;
import org.apache.hadoop.hive.ql.exec.UDF;
import java.util.regex.Pattern;
/**
 * 自定義UDF函式
 * 輸入：Tom
 * 輸出：hello:Tom
  
*/
@Description(
        name = "udf_is_null",
        value = "_FUNC_(str) - Returns str is null?0:1",
        extended = "Example:\n  > SELECT _FUNC_(\'Facebook\') FROM src LIMIT 1;\n   return    1 "
)
public class UdfIsNull extends UDF {
    public int evaluate(final String s) {
        if (s == null 
  || s.toString().trim().toLowerCase().equals("null") || Pattern.matches("\\s+",s.toString())||s.toString().trim().equals("")) {
            return 0;
        }
        return 1;
    }
    public static void main(String[] args) {
        System.out.println("值為"+new UdfIsNull().evaluate(new String("null"  )));
    }
}

方式一：新增臨時函式(僅當前會話有效)

a）將jar上傳至伺服器，進入hive，執行： add jar /root/jar/hive_function-1.0-SNAPSHOT.jar;

b）執行命令，新增臨時函式：create temporary function udf_is_null as 'com.bigdata.hive.udf.UdfIsNull';

c）檢視函式 desc function udf_is_null;

d）測試函式:select udf_is_null(“”);

方式二：新增永久函式（永久函式，建立後可以在任意客戶端使用）

a）將jar上傳至hdfs檔案系統：hdfs dfs -put ./hive_function-1.0-SNAPSHOT.jar /libs

b）進入hive,建立函式

create function udf_is_null

as 'com.bigdata.hive.udf.UdfIsNull'

using jar 'hdfs:///libs/hive_function-1.0-SNAPSHOT.jar'

hive新增自定義函式

hive新增自定義函式方式有兩種，一種是繼承UDF ，另一種繼承GenericUDF UDF開發較為方便，先新版本中已被棄用，建議使用GenericUDF org.apache.hadoop.hive.ql.exec.UDF

建立 hive 使用者自定義函式UDF

目錄1. 建立 Maven 工程2. 開發 Java 類整合 UDF3. 專案打包，並上傳到hive的lib目錄下4. 新增jar包重新命名 jar 包hive 客戶端新增 jar包5. 設定函式與我們的自定義函式關聯6. 使用自定義函式

JQuery #查素 #修改 #新增/刪除/替換 #事件 #動畫 #類陣列物件操作 #新增自定義函式 #封裝自定義外掛 #ajax

技術標籤：javascript 簡單介紹以下JQuery 1.JQuery還是在執行DOM增刪改查+事件繫結 2.為什麼用：簡單,JQ幾乎沒有瀏覽器相容問題

002.hive-UDF自定義函式

IDEA 配置檔案 pom.xml <?xml version=\"1.0\" encoding=\"UTF-8\"?> <project xmlns=\"http://maven.apache.org/POM/4.0.0\"

hive常見自定義函式

hive自定義函式 1 自定義函式 1.1 為什麼需要自定義函式 hive的內建函式滿足不了所有的業務需求。

新增 Hive 自定義函式

使用 Java 編寫好 UDF 或 UDAF 函式後，Hive 要如何使用這些自定義函式呢？ 1 在 HDFS 上建立存放 jar 包的目錄

Hive 自定義函式

Hive的SQL可以通過使用者定義的函式（UDF），使用者定義的聚合（UDAF）和使用者定義的表函式（UDTF）進行擴充套件。

hive 查詢語法 shell引數自定義函式

4. Hive 查詢語法 4.1. SELECT SELECT [ALL | DISTINCT] select_expr, select_expr, ...FROM table_reference[WHERE where_condition][GROUP BY col_list [HAVING condition]][CLUSTER BY col_list| [DISTRIBUTE BY