Flink實戰（110）：flink-sql使用（十八）connector（十九）Flink Hive Connector 使用

阿新 • • 發佈：2020-12-23

來源：https://www.yuque.com/docs/share/14a7a0e8-37d1-4142-8962-48dcf3761f7e?#

Flink 1.12 版本

1. Hive 建表

//1、建立 Hive 資料庫
create database zhisheng;

//2、檢視建立的資料庫
show databases;

//3、使用建立的資料庫
use zhisheng;

//4、在該庫下建立 Hive 表
CREATE TABLE IF NOT EXISTS flink ( 
  appid int, 
  message String
) ROW FORMAT DELIMITED
FIELDS TERMINATED  
BY '\t'
LINES TERMINATED BY '\n'
STORED AS TEXTFILE;

//5、往該表插入一條資料
insert into flink values(11111, '233sadadadwqqdq');

2.Flink 讀取 Hive 已經存在的表資料

//1、建立 Hive CATALOG，Flink 通過 catalog 不僅可以將自己的表寫入 Hive 的 metastore，也能讀寫 Hive 的表
CREATE CATALOG flinkHiveCatalog WITH (
    'type' = 'hive',
    'default-database 
' = 'zhisheng',
    'hive-conf-dir' = '/app/apache-hive-2.1.1-bin/conf'
);

//2、使用該 Catalog
USE CATALOG flinkHiveCatalog;

//3、因為剛才已經寫入了一條資料到 Hive 表(flink) 
select * from flink;

3.Flink 往 Hive 中已經存在的表寫資料

//1、建立 Source 表
CREATE TABLE yarn_log_datagen_test_hive_sink (
 appid INT,
 message STRING
) WITH (
  
'connector' = 'datagen',
 'rows-per-second'='10',
 'fields.appid.kind'='random',
 'fields.appid.min'='1',
 'fields.appid.max'='1000',
 'fields.message.length'='100'
);

//2、將資料寫入到 Hive 表
insert into flink select * from yarn_log_datagen_test_hive_sink;

//再次查詢 Hive 表裡面的資料
select * from flink;

直接在 Hive 利用命令查詢：

4 .完整 Example

CREATE CATALOG flinkHiveCatalog WITH (
'type' = 'hive',
'default-database' = 'zhisheng',
'hive-conf-dir' = '/app/apache-hive-2.1.1-bin/conf'
);

USE CATALOG flinkHiveCatalog;

SET table.sql-dialect=hive;   -- 建立 Hive 表要指定 sql-dialect 為 Hive，否則建立的時候識別不了下面的 DDL 語句
CREATE TABLE yarn_logs (
  appid INT,
  message STRING
) PARTITIONED BY (dt STRING, hr STRING) STORED AS parquet TBLPROPERTIES (
  'partition.time-extractor.timestamp-pattern'='$dt $hr:00:00',
  'sink.partition-commit.trigger'='partition-time',
  'sink.partition-commit.delay'='1 h',
  'sink.partition-commit.policy.kind'='metastore,success-file',
  'sink.parallelism'='2' -- 該引數內部才支援設定並行度
);

SET table.sql-dialect=default;  -- 建立 Flink 表又要換回預設的 sql-dialect，Flink 支援在同一個 SQL 裡面設定多個 sql-dialect
CREATE TABLE yarn_log_datagen_test (
  appid INT,
  message STRING,
  log_ts TIMESTAMP(3),
  WATERMARK FOR log_ts AS log_ts - INTERVAL '5' SECOND
) WITH (
'connector' = 'datagen',
'rows-per-second' = '10',
'fields.appid.kind' = 'random',
'fields.appid.min' = '1',
'fields.appid.max' = '1000',
'fields.message.length' = '100'
);


-- streaming sql, insert into hive table
INSERT INTO yarn_logs 
SELECT appid, message, DATE_FORMAT(log_ts, 'yyyy-MM-dd'), DATE_FORMAT(log_ts, 'HH')
FROM yarn_log_datagen_test;

-- batch sql, select with partition pruning
SELECT * FROM yarn_logs WHERE dt='2020-12-16' and hr='12';

檢視 table 的儲存路徑

show create table yarn_logs;

Flink例項（二十）：自定義時間和視窗的操作符（一）KeyedProcessFunction（一）

前言　　在Flink中比如某些運算元（join,coGroup,keyBy,groupBy）要求在資料元上定義key。另外有些運算元操作，例如reduce，groupReduce，Aggregate，Windows需要資料在處理之前根據key進行分組。

Flink例項（二十一）：自定義時間和視窗的操作符（二）KeyedProcessFunction（二）

KeyedProcessFunction 　　KeyedProcessFunction用來操作KeyedStream。KeyedProcessFunction會處理流的每一個元素，輸出為0個、1個或者多個元素。所有的Process Function都繼承自RichFunction介面，所以都有open()、

Flink例項（五十五）：自定義時間和視窗的操作符（十）TimestampAssigner介面（一）設定事件時間

在flink中設定事件時間時需要將時間的表示轉換為毫秒如果不需要轉換 def main(args: Array[String]): Unit = {

Flink例項（五十六）：自定義時間和視窗的操作符（十一）TimestampAssigner介面（二）生成水印的三個過載方法

https://www.cnblogs.com/Springmoon-venn/p/11403665.html Timestamp 和Watermark 的概念: 1. Timestamp和Watermark都是基於事件的時間欄位生成的

Flink例項（六十七）：自定義時間和視窗的操作符（十二）Flink事件時間何時觸發視窗計算

目錄 1.1 瀏覽本部落格前你需要了解的知識點 flink內部是如何劃分視窗的？

Flink例項（106）：自定義時間和視窗的操作符（十二）自定義視窗分配器周、月

自定義 WindowAssigner 如果我們定義按天、小時、分鐘的滾動視窗都很容易實現。

Flink例項（114）：自定義時間和視窗的操作符（十三）自定義視窗分配器之設定視窗開始與結束時刻

1.自定義視窗分配器（flink1.11.2） package com.atguigu.exercise.ETL.caiutil import java.text.SimpleDateFormat

【轉】2.1【MySQL】執行原理（一）：查詢sql的執行過程及MySQL架構分析

MySQL的發展歷史和版本分支：時間里程碑1996 年MySQL1.0 釋出。它的歷史可以追溯到 1979 年，作者 Monty 用 BASIC 設計的一個報表工具。1996 年 10 月3.11.1 釋出。MySQL 沒有 2.x 版本。2000 年ISAM 升級成 My

Quartz.Net系列（十四）：詳解Job中兩大特性（DisallowConcurrentExecution、PersistJobDataAfterExecution）

1.DisallowConcurrentExceution 從字面意思來看也就是不允許併發執行簡單的演示一下

ROS中階筆記（四）：機器人模擬—Gazebo物理模擬環境搭建（重點）

ROS中階筆記（四）：機器人模擬—Gazebo物理模擬環境搭建（重點）目錄1 ros_control1.1 ros_control安裝2 Gazebo模擬步驟（重點）2.1 配置物理模擬模型2.1.1 第一步：為link新增慣性引數和碰撞屬性2.1.2 第二步：為

MSSQL系列（二）：表相關操作、列操作、（唯一、主鍵、預設、檢查、外來鍵、非空）約束、臨時表

1.建立表 --建立學生班級表 create table StuClass ( ClassId int primary key, --班級ID 主鍵約束

FFmpeg開發筆記（五）：ffmpeg解碼的基本流程詳解（ffmpeg3新解碼api）

若該文為原創文章，未經允許不得轉載原博主部落格地址：https://blog.csdn.net/qq21497936原博主部落格導航：https://blog.csdn.net/qq21497936/article/details/102478062本文章部落格地址：https://blog.csdn.net

CI/CD（持續整合構建/持續交付）：如何測試/整合/交付專案程式碼？（Jenkins，TravisCI）

Table of Contents CI(Continuous integration，持續整合) CD(Continuous Delivery，持續交付) Different types of testing explained

Kubernetes:52---配置應用程式（Secret物件：在私有倉庫中使用secret拉取registry映象）

技術標籤：KubernetesSecret物件一、介紹你已經學會了如何傳遞Secret給應用程式並使用它們包含的資料。 Kubernetes自身在有些時候希望我們能夠傳遞證書給它，比如從某個私有映象倉庫拉取映象時。這一點同樣需通

Flink實戰（110）：flink-sql使用（十八）connector（十九）Flink Hive Connector 使用

來源：https://www.yuque.com/docs/share/14a7a0e8-37d1-4142-8962-48dcf3761f7e?# Flink 1.12 版本 1. Hive 建表

Flink實戰（七十八）：flink-sql使用（六）Flink 與 hive 結合使用（一）配置

1 hive 安裝hive，使用mysql做為元資料儲存 1.2 hive-site.xml 配置（版本3.1.2） <?xml version=\"1.0\"?>

Flink實戰（八十五）：flink-sql使用（十二）Flink 與 hive 結合使用（四）Hive Read & Write

0 簡介 Using the HiveCatalog and Flink’s connector to Hive, Flink can read and write from Hive data as an alternative to Hive’s batch engine. Be sure to follow the instructions to include the co

Flink實戰（八十六）：flink-sql使用（十三）Flink 與 hive 結合使用（五）Hive Streaming

0 Hive Streaming A typical hive job is scheduled periodically to execute, so there will be a large delay.

Flink實戰（八十七）：flink-sql使用（十四）Flink 與 hive 結合使用（六）Hive 函式

1 通過 HiveModule 使用 Hive 內建函式在 Flink SQL 和 Table API 中，可以通過系統內建的HiveModule來使用 Hive 內建函式，

Flink實戰（九十八）：flink-sql使用（十六）雙流join（一）雙流 join 場景應用

本文主要介紹在流式場景中 join 的實戰。大家都知道在使用 SQL 進行資料分析的過程中，join 是經常要使用的操作。在離線場景中，join 的資料集是有邊界的，可以快取資料有邊界的資料集進行查詢，有Nested Loop/Hash

Flink實戰（110）：flink-sql使用（十八）connector（十九）Flink Hive Connector 使用

1. Hive 建表

2.Flink 讀取 Hive 已經存在的表資料

3.Flink 往 Hive 中已經存在的表寫資料

4 .完整 Example

相關推薦