hive UDF 開發示例

阿新 • • 發佈：2018-12-19

一、建立一個java專案

對應的pom檔案

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>com.credithc</groupId>
    <artifactId>hive_udf_v1.0</artifactId>
    <version>1.0-SNAPSHOT</version>


    <!-- 根據要連線的hadoop和hive，設定版本引數 -->
    <properties>
        <maven.compiler.source>1.8</maven.compiler.source>
        <maven.compiler.target>1.8</maven.compiler.target>
        <maven-compiler-plugin.version>3.7.0</maven-compiler-plugin.version>

    </properties>

    <!-- 因為使用CDH的hadoop和hive，因此要新增CDH的官方repository，才能夠下載相應的依賴包 -->
    <!-- 如果使用Apache版本的hadoop和hive，則不需要新增該repository -->
    <repositories>
        <repository>
            <id>cloudera</id>
            <url>http://repository.cloudera.com/artifactory/cloudera-repos</url>
        </repository>
    </repositories>
    <dependencies>
        <!-- 新增依賴元件，根據上方配置的版本引數和repository知識庫下載依賴 -->
        <dependency>
            <groupId>org.elasticsearch</groupId>
            <artifactId>elasticsearch-hadoop-mr</artifactId>
            <version>5.6.3</version>
        </dependency>

        <dependency>
            <groupId>org.elasticsearch</groupId>
            <artifactId>elasticsearch-hadoop-hive</artifactId>
            <version>5.6.3</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hive</groupId>
            <artifactId>hive-exec</artifactId>
            <version>2.0.0</version>
        </dependency>
        <!-- junit是java的單元測試框架 -->
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>4.10</version>
            <scope>test</scope>
        </dependency>
        <dependency>
            <groupId>org.apache.maven.plugins</groupId>
            <artifactId>maven-resources-plugin</artifactId>
            <version>2.4.3</version>
        </dependency>

    </dependencies>
    <build>
        <plugins>
            <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.5.1</version>
                <configuration>
                    <source>1.8</source>
                    <target>1.8</target>
                </configuration>
            </plugin>
        </plugins>
    </build>
</project>

二、UDF函式建立開發：

package com.credithc.rc.kg.udf;

import org.apache.commons.lang.StringUtils;
import org.apache.hadoop.hive.ql.exec.UDF;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * Created by glin on 2018/11/1 0001.    com.credithc.rc.kg.udf.MessageDecodeUdf
 */
public class MessageDecodeUdf extends UDF{

    public MessageDecodeUdf(){
    }

    public String evaluate(String str,String params) {
        if(StringUtils.isEmpty(str)||StringUtils.isEmpty(params))
            return null;
        String re = null;
        try {
            switch (params) {
                //時間抽取
                case "time":
                    re = parserTime(str);
                    break;
                //銀行名稱抽取
                case "bankName":
                    re = parserBankName(str);
                    break;
            }
        }catch (Exception e){

        }
        return re;
    }

    public String parserTime(String str){
        //提取時間
        Pattern p0 =Pattern.compile("\\d{4}年\\d{1,2}月\\d{1,2}日|\\d{1,2}月\\d{1,2}日|\\d{4}[-|/|.]\\d{1,2}[-|/|.]\\d{1,2}");
        //時間匹配
        Matcher m0 = p0.matcher(str);
        if(m0.find()){
            return m0.group(0);
        }else{
            return null;
        }
    }


    public String parserBankName(String str){
        //提取[]裡的內容
        Pattern p1 = Pattern.compile("\\[(.+?銀行)\\]");
        //銀行
        Matcher m1 = p1.matcher(str);
        if(m1.find()){
            return m1.group(1);
        }else{
            return null;
        }
    }




    }

public static void main(String[] args) {
        MessageDecodeUdf dd = new MessageDecodeUdf();
        System.out.println(dd.evaluate(" 。下載“中國建設銀行”手機銀行APP 。[建設銀行]", "time"));

    }
}

測試執行結果：

三、匯出 jar包：

三、上傳hive測試：

找到該函式，滑鼠右鍵選擇Copy Reference 獲得該函式的全路徑：com.credithc.ss.sd.udf.MessageDecodeUdf

-- 將上傳的jar包匯入到classpath變數裡

hdfs dfs -put /home/sd/test/hive_udf_v1.0-1.0-SNAPSHOT.jar user/sd/hive_udf/

list jars; -- 檢視匯入的jar包

create temporary function message_udf as 'com.credithc.ss.sd.udf.MessageDecodeUdf'; -- 建立一個臨時函式，關聯該jar包

使用測試：

select message_udf ( str, params) from kkkk;

hive UDF 開發示例

一、建立一個java專案對應的pom檔案 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache.org/POM/4.0.0" xm

hive udf開發超詳細手把手教程(有些過時了)

mvn install 直接打包 maven打包上面程式碼測試通過以後，然後用maven打成jar包。如果是老司機，自然知道怎麼做。如果是新司機，我偷偷告訴大家，eclipse裡在專案上右擊，選擇 run as，然後maven install，maven就開始幫你打包了。如果是第一次，mave

Hive UDF開發例項

Hive UDF簡介： Hive UDF（Hive User-Defined Function）開發是在資料分析的時候如果內建的函式解析不了的情況下去做的開發，擴充套件HiveSQL功能的自定義函式。有兩種API：簡單API： org.apache.hadoop.hive

Hive UDF開發指南(轉）

編寫Apache Hive使用者自定義函式（UDF）有兩個不同的介面，一個非常簡單，另一個...就相對複雜點。如果你的函式讀和返回都是基礎資料型別（Hadoop&Hive 基本writable型別，如Text,IntWritable,LongWriable,D

Hive UDF開發指南

簡述編寫Apache Hive使用者自定義函式（UDF）有兩個不同的介面，一個非常簡單，另一個...就相對複雜點。如果你的函式讀和返回都是基礎資料型別（Hadoop&Hive 基本writable型別，如Text,IntWritable,LongWriable,

UDF開發以及如何新增到HIVE中

自定義開發案例 1）建立一個java工程，並建立一個lib資料夾 2）將hive的jar包解壓後，將apache-hive-1.2.2-bin\lib檔案下的jar包都拷貝到java工程中。 3）建立一個類 package com.lzl.hive;

hive中UDF開發：解析json物件和解析json陣列物件

hive預設函式： +-------------------------------------------------------------------+ json +--------------

udf開發——解hive外表中的pb二進位制資料

目標：hbase中有一張表，為了提高儲存效率使用pb的二進位制方式儲存；現在hive上建了一個外表，需要寫一個udf解pb的二進位制資料。一、hbase中儲存的資料先用pb生成二進位制，轉成string後再使用base64編碼： 1、在hive中建立外表，結構如下：

Hive 高階應用開發示例(一)

Hive的一些常用的高階開發內容 1.開窗函式 2.行轉列,列轉行,多行轉一行，一行轉多行 3.分組：增強型group 4.排序 5.關聯本次的內容：內容1 和內容2，採用的是示例

Hive UDAF開發詳解

-s 聚合而且 pri ros cal 關系方法調用 evaluator 明這篇文章是來自Hadoop Hive UDAF Tutorial - Extending Hive with Aggregation Functions：的不嚴格翻譯，因為翻譯的文章示例寫得比較

K/3 Cloud 產品報價單_表單插件開發示例

ted pac upd chan sele RKE order .exe lis using Kingdee.BOS; using Kingdee.BOS.App.Data; using Kingdee.BOS.Core.DynamicForm.PlugIn; using

OpenCV與QT聯合開發示例

http 機會資料使用對象 enc 導入測試 activity 1、OpenCV及QT開發環境搭建 windows基於vs2017的opencv安裝 windows下安裝QT並與visual studio 2017搭建開發環境 2、工程創建 1、導入Qt項目

這30個以太坊開發示例，讓你成為80萬都挖不走的區塊鏈人才！

2018年已過了大半，幣圈跌跌蕩蕩，而鏈圈的人在等待鳳凰涅槃，熊市專心做技術，牛市才能一展身手、衝破雲霄！本文主要告訴你，如何成為一名優秀的以太坊開發者！如果你是以太坊開發者中的“老司機”，請直接看最後一部分：30個為你量身定做的挑戰示例！如果你是以太坊

Generic UDF開發測試

對於hive開發udf繼承GenericUDF需要實現三個必要的方法 initialize方法需要宣告返回值型別 evaluate實現主要邏輯 getDisplayString(沒研究明白) 記錄開發測試： 1.在initialize方法中什麼都不寫直接返回nul

Hive UDF函式編寫流程詳解

參考官網： https://cwiki.apache.org/confluence/display/Hive/HivePlugins 新增hive UDF函式 https://cwiki.apache.org/confluence/displ

LGame Android版開發示例之連連看

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

K3老單序時簿開發示例

K3需要對老單進行二次開發，老單的二次開發比較麻煩，這裡整理一下老單序時簿上新增按鈕的二次開發示例。 --以下SQL指令碼--獲取 MENU IDselect FID,FmenuID,FName from iclisttemplate where Fname LIKE '%生產領料%' --

Hive- UDF&GenericUDF

原文連結：https://www.jianshu.com/p/ca9dce6b5c37 Hive- UDF&GenericUDF hive udf簡介在Hive中，使用者可以自定義一些函式，用於擴充套件HiveQL的功能，而這類函式叫做UDF

hive plsql使用示例

使用Hive做資料開發時候，一般是將一段一段的HQL語句封裝在Shell或者其他指令碼中，然後以命令列的方式呼叫，完成一個業務或者一張報表的統計分析。好訊息是，現在已經有了Hive儲存過程的解決方案（HPL/SQL –Procedural SQL on Hadoop），並且Hive的版本2.0之後的

Redis模組開發示例

實現一個Redis module，支援兩個擴充套件命令： 1) 可同時對hash的多個field進行incr操作； 2) incrby同時設定一個key的過期時間在沒有module之前，需要藉助eval+lua實現相同的功能。有了module，不但可以實現邏輯複雜，且效能高的擴充套件，

hive UDF 開發示例

相關推薦