Flink從入門到真香(17、Flink 重磅功能 Table API(Flink SQL))

阿新 • • 發佈：2020-11-26

Flink對批處理和流處理，提供了統一的上層API
Table API是一套內嵌在java和scala語言中的查詢api，它允許以非常直觀的方式組合來自一些關係運算符的查詢
Flink的sql支援基於實現了sql標準的Apache calcite

先來個栗子感受下：

demo效果：在資料來源txt中讀取，輸出id和temperature 這2個欄位，按照id做篩選，輸出，分別用table api和sql來實現

在pom.xml中加入依賴

<dependency>
    <groupId>org.apache.flink</groupId>
    <artifactId>flink-table-planner_2.12</artifactId>
    <version>1.10.1</version>
</dependency>

<!--        也可以不用引入下面的包，因為上面已經包含了-->
<dependency>
    <groupId>org.apache.flink</groupId>
    <artifactId>flink-table-api-scala-bridge_2.12</artifactId>
    <version>1.10.1</version>
</dependency>

在tabletest包下建一個Example object：

package com.mafei.apitest.tabletest

import com.mafei.sinktest.SensorReadingTest5
import org.apache.flink.streaming.api.scala._
import org.apache.flink.table.api.Table
import org.apache.flink.table.api.scala._

object Example {
  def main(args: Array[String]): Unit = {
    //建立執行環境
    val env = StreamExecutionEnvironment.getExecutionEnvironment

    env.getConfig.setAutoWatermarkInterval(200) //直接全域性設定watermark的時間為200毫秒
    val inputStream = env.readTextFile("/opt/java2020_study/maven/flink1/src/main/resources/sensor.txt")

    env.setParallelism(1)

    //先轉換成樣例類型別
    val dataStream = inputStream
      .map(data => {
        val arr = data.split(",") //按照,分割資料，獲取結果
        SensorReadingTest5(arr(0), arr(1).toLong, arr(2).toDouble) //生成一個感測器類的資料，引數中傳toLong和toDouble是因為預設分割後是字串類別
      })

    //首先建立表執行環境
    val tableEnv = StreamTableEnvironment.create(env)

    //基於流建立一張表
    val dataTable: Table = tableEnv.fromDataStream(dataStream)

    //呼叫table api進行轉換
    val resultTable = dataTable
      .select("id, temperature")
      .filter("id == 'sensor3'")

    resultTable.toAppendStream[(String,Double)].print("result")

    //第二種，直接寫sql來實現
    tableEnv.createTemporaryView("table1", dataTable)
    val sql: String = "select id, temperature from table1 where id='sensor1'"
    val resultSqlTable = tableEnv.sqlQuery(sql)
    resultSqlTable.toAppendStream[(String, Double)].print("result sql")

    env.execute("table api example")
  }

}

程式碼結構及執行效果：

Flink從入門到真香(17、Flink 重磅功能 Table API(Flink SQL))

看到效果之後再來分析結構：
Table API和SQL的程式結構，與流式處理的程式結構十分類似


//建立表執行環境
val tableEnv = StreamTableEnvironment.create(StreamExecutionEnvironment.getExecutionEnvironment)

//建立一張表，用於讀取資料
tableEnv.connect(....).createTemporayTable("inputTable")

//註冊一張表，用於把計算結果輸出
tableEnv.connect(....).createTemporaryTable("outputTable")

//通過Table API查詢運算元，得到一張結果表
val result = tableEnv.from（"inputTable").select()

//通過sql查詢語句，得到一張表
val sqlResult = tableEnv.sqlQuery("select id, temperature from table1 where id='sensor1'")

//將結果表寫入到輸出表中
result.insertInto("outputTable")

幾種引擎實現方式

Flink SQL有好幾種實現方式，其中blink 是阿里內部使用後來開源合併到flink的引擎，來看看幾種使用方式

/**
 *
 * @author mafei
 * @date 2020/11/22
 */

package com.mafei.apitest.tabletest

import org.apache.flink.api.scala.ExecutionEnvironment
import org.apache.flink.streaming.api.scala._
import org.apache.flink.table.api.{EnvironmentSettings, TableEnvironment}
import org.apache.flink.table.api.scala._

object TableApi1 {
  def main(args: Array[String]): Unit = {
    //1 、建立環境
    val env = StreamExecutionEnvironment.getExecutionEnvironment
    env.setParallelism(1)

    val tableEnv = StreamTableEnvironment.create(env)

    //1,1 基於老版本的planner的流處理
    val settings = EnvironmentSettings.newInstance()
      .useOldPlanner()
      .inStreamingMode()
      .build()
    val oldStreamTableEnv = StreamTableEnvironment.create(env, settings)

    //1.2 基於老版本的批處理環境
    val batchEnv = ExecutionEnvironment.getExecutionEnvironment

    val oldBatchTableEnv = BatchTableEnvironment.create(batchEnv)

    //1.3基於blink planner的流處理
    val blinkStreamSettings = EnvironmentSettings.newInstance()
      .useBlinkPlanner()
      .inStreamingMode()
      .build()
    val blinkStreamTableEnv = StreamTableEnvironment.create(env, blinkStreamSettings)

    //基於blink planner的批處理
    val blinkBatchSettings = EnvironmentSettings.newInstance()
      .useBlinkPlanner()
      .inBatchMode()
      .build()
    val blinkBatchTableEnv = TableEnvironment.create(blinkBatchSettings)

  }
}

Flink從入門到真香(17、Flink 重磅功能 Table API(Flink SQL))

Flink對批處理和流處理，提供了統一的上層APITable API是一套內嵌在java和scala語言中的查詢api，它允許以非常直觀的方式組合來自一些關係運算符的查詢Flink的sql支援基於實現了sql標準的Apache calcite

Flink從入門到入土（詳細教程）

和其他所有的計算框架一樣，flink也有一些基礎的開發步驟以及基礎，核心的API，從開發步驟的角度來講，主要分為四大部分

ES6從入門到精通——Symbol、Map 與 Set

技術標籤：ES6es6 Symbol ES6 引入了一種新的原始資料型別Symbol，表示獨一無二的值。它是 JavaScript 語言的第七種資料型別，前六種是：undefined、null、布林值（Boolean）、字串（String）、數值（Number）、

Swoole從入門到入土(17)——WebSocket伺服器[成員函式與配置選項]

這一節，我們重點了解websocket server的成員函式以及相關的配置選項。 1、成員函式

Restframework從入門到精通(四)：Restframework之超連結API

演示前配置拿外來鍵的例子來說，Book的外來鍵是Publish，點選Book的超連結API就可以訪問到外來鍵的Publish

Exception in thread “main“ org.apache.flink.table.api.SqlParserException: SQL parse failed. Encounte

技術標籤：大資料 Exception in thread "main" org.apache.flink.table.api.SqlParserException: SQL parse failed. Encountered "table" at line 1, column 308.

Flink1.12.1通過Table API / Flink SQL讀取HBase2.4.0

昨天群裡有人問 Flink 1.12 讀取Hbase的問題，於是看到這篇文章分享給大家。本文作者Ashiamd。

大資料Hadoop之——Flink Table API 和 SQL（單機Kafka）

目錄一、Table API 和 Flink SQL 是什麼二、配置Table依賴（scala）三、兩種 planner（old & blink）的區別

go語言20小時從入門到精通（九、異常處理）

##9.1 error介面 Go語言引入了一個關於錯誤處理的標準模式，即error介面，它是Go語言內建的介面型別，該介面的定義如下：

go語言20小時從入門到精通（三、運運算元）

##3.1 算術運運算元 ##3.2 關係運算子 ##3.3 邏輯運運算元 ##3.4 位運運算元位運算參考

go語言20小時從入門到精通（八、面向物件程式設計）

##8.1 概述對於面向物件程式設計的支援Go 語言設計得非常簡潔而優雅。因為， Go語言並沒有沿襲傳統面向物件程式設計中的諸多概念，比如繼承(不支援繼承，儘管匿名欄位的記憶體佈局和行為類似繼承，但它並不是繼承)、

go語言20小時從入門到精通（七、複合型別）

##7.1 分類 ##7.2 指標指標是一個代表著某個記憶體地址的值。這個記憶體地址往往是在記憶體中儲存的另一個變數的值的起始位置。Go語言對指標的支援介於Java語言和C/C++語言之間，它既沒有想Java語言那樣取消了程式

go語言20小時從入門到精通（六、工程管理）

在實際的開發工作中，直接呼叫編譯器進行編譯和連結的場景是少而又少，因為在工程中不會簡單到只有一個原始碼檔案，且原始檔之間會有相互的依賴關係。如果這樣一個檔案一個檔案逐步編譯，那不亞於一場災難。 Go語言的

Flink從Kafka讀取資料存入MySQL

Flink從Kafka讀取資料存入MySQL 執行環境 os Version:win10 Flink Version:1.6.2 Kafka Version:0.9.0.0

Redis從入門到深入-鎖(17)

1. 鎖 1.1 基於特定條件的事務執行業務場景天貓雙11熱賣過程中，對已經售罄的貨物追加補貨，4個業務員都有許可權進行補貨。補貨的操作可能是一系列的操作，牽扯到多個連續操作，如何保障不會重複操作?

Rest Assured從入門到遇到各種問題（彙總、更新）

目前還在最初級用微信企業版模擬傳送應用訊息 maven專案使用Junit5執行單元測試，使用rest assured 傳送post請求，程式碼如下：

《Java從入門到失業》第三章：基礎語法及基本程式結構（三）：基本資料型別（整型、浮點型、布林型）

前面我們說過，在Java中，每一個變數都必須歸屬一種型別。Java一共有8種基本資料型別（primitive type）。其中包括4種整型，2種浮點型，1種字元型和1種布林型。

Flink 從 0 到 1 學習之（2） Flink 配置檔案詳解

前面文章我們已經知道 Flink 是什麼東西了，安裝好 Flink 後，我們再來看下安裝路徑下的配置檔案吧。

Flink 從 0 到 1 學習之（3） Data Source 介紹

前言 Data Sources 是什麼呢？就字面意思其實就可以知道：資料來源。 Flink 做為一款流式計算框架，它可用來做批處理，即處理靜態的資料集、歷史的資料集；也可以用來做流處理，即實時的處理些實時資料流，實時的產

Flink 從 0 到 1 學習之（5）如何自定義 Data Source ？

前言我給大家介紹了 Flink Data Source 以及簡短的介紹了一下自定義 Data Source，這篇文章更詳細的介紹下，並寫一個 demo 出來讓大家理解。

Flink從入門到真香(17、Flink 重磅功能 Table API(Flink SQL))

demo效果： 在資料來源txt中讀取，輸出id和temperature 這2個欄位，按照id做篩選，輸出，分別用table api和sql來實現

程式碼結構及執行效果：

幾種引擎實現方式

相關推薦

demo效果：在資料來源txt中讀取，輸出id和temperature 這2個欄位，按照id做篩選，輸出，分別用table api和sql來實現