mark，解決flink sql叢集提交任務不能指定名字的問題

阿新 • • 發佈：2020-10-11

1）先上一段程式碼

package com.rookie.submit.main

import java.io.File

import com.rookie.submit.common.{Common, Constant}
import com.rookie.submit.common.Constant._
import com.rookie.submit.util.{RegisterUdf, SqlFileUtil, TableConfUtil}
import org.apache.flink.api.java.utils.ParameterTool
import org.apache.flink.contrib.streaming.state.RocksDBStateBackend
import org.apache.flink.runtime.state.StateBackend
import org.apache.flink.runtime.state.filesystem.FsStateBackend
import org.apache.flink.streaming.api.CheckpointingMode
import org.apache.flink.streaming.api.scala.StreamExecutionEnvironment
import org.apache.flink.table.api.bridge.scala.StreamTableEnvironment
import org.apache.flink.table.api.{EnvironmentSettings, SqlDialect, StatementSet}
import org.apache.flink.table.catalog.hive.HiveCatalog
import org.slf4j.LoggerFactory

import scala.collection.JavaConversions._

/**
  * sqlSubmit main class
  * input sql file name and execute sql content
  */
object SqlSubmit {

  private val logger = LoggerFactory.getLogger("SqlSubmit")

  def main(args: Array[String]): Unit = {
    // parse input parameter and load job properties
    val paraTool = Common.init(args)

    // parse sql file
    val sqlList = SqlFileUtil.readFile(paraTool.get(INPUT_SQL_FILE_PARA))

    // StreamExecutionEnvironment
    val env = StreamExecutionEnvironment.getExecutionEnvironment
    // state backend and checkpoint
    enableCheckpoint(env, paraTool)
    // EnvironmentSettings
    val settings = EnvironmentSettings.newInstance()
      .useBlinkPlanner()
      .inStreamingMode()
      .build()
    // create table enviroment
    val tabEnv = StreamTableEnvironment.create(env, settings)
    // table Config
    TableConfUtil.conf(tabEnv, paraTool)

    // register catalog, only in server
    if ("/".equals(File.separator)) {
      //      val catalog = new HiveCatalog(paraTool.get(Constant.HIVE_CATALOG_NAME), paraTool.get(Constant.HIVE_DEFAULT_DATABASE), paraTool.get(Constant.HIVE_CONFIG_PATH), paraTool.get(Constant.HIVE_VERSION))
      val catalog = new HiveCatalog(paraTool.get(Constant.HIVE_CATALOG_NAME), paraTool.get(Constant.HIVE_DEFAULT_DATABASE), paraTool.get(Constant.HIVE_CONFIG_PATH))
      tabEnv.registerCatalog(paraTool.get(Constant.HIVE_CATALOG_NAME), catalog)
      tabEnv.useCatalog(paraTool.get(Constant.HIVE_CATALOG_NAME))
    }

    // load udf
    RegisterUdf.registerUdf(tabEnv)

    // execute sql
    val statement = tabEnv.createStatementSet()
    var result: StatementSet = null
    for (sql <- sqlList) {
      try {
        if (sql.startsWith("insert")) {
          // ss
          result = statement.addInsertSql(sql)
        } else {
          if (sql.contains("hive_table_")) {
            tabEnv.getConfig().setSqlDialect(SqlDialect.HIVE)
          } else {
            tabEnv.getConfig().setSqlDialect(SqlDialect.DEFAULT)
          }
          logger.info("dialect : " + tabEnv.getConfig.getSqlDialect)
          println("dialect : " + tabEnv.getConfig.getSqlDialect)
          tabEnv.executeSql(sql)
        }
        logger.info("execute success : " + sql)
        println("execute success : " + sql)
      } catch {
        case e: Exception =>
          println("execute sql error : " + sql)
          logger.error("execute sql error : " + sql, e)
          e.printStackTrace()
          System.exit(-1)
      }
    }
    // execute insert
    result.execute(Common.jobName)
//    result.execute()
    // not need, sql will execute when call executeSql
    //    env.execute(Common.jobName)
  }

  def enableCheckpoint(env: StreamExecutionEnvironment, paraTool: ParameterTool): Unit = {
    // state backend
    var stateBackend: StateBackend = null
    if ("rocksdb".equals(paraTool.get(STATE_BACKEND))) {
      stateBackend = new RocksDBStateBackend(paraTool.get(CHECKPOINT_DIR), true)
    } else {
      stateBackend = new FsStateBackend(paraTool.get(CHECKPOINT_DIR), true)
    }
    env.setStateBackend(stateBackend)
    // checkpoint
    env.enableCheckpointing(paraTool.getLong(CHECKPOINT_INTERVAL) * 1000, CheckpointingMode.EXACTLY_ONCE)
    env.getCheckpointConfig.setCheckpointTimeout(paraTool.getLong(CHECKPOINT_TIMEOUT) * 1000)
    // Flink 1.11.0 new feature: Enables unaligned checkpoints
    env.getCheckpointConfig.enableUnalignedCheckpoints()
  }

}

關鍵在於 StatementSet物件:

我們發現這個類，不支援這個傳入引數，所以我們需要修改原始碼：

3）如圖，主要是StatementSetImpl這個實現新增的方法

4）需要編譯打包，這些類屬於

package org.apache.flink.table

5）github參考地址：

https://github.com/springMoon/sqlSubmit/blob/master/src/main/scala/com/rookie/submit/main/SqlSubmit.scala

mark，解決flink sql叢集提交任務不能指定名字的問題

1）先上一段程式碼 package com.rookie.submit.main import java.io.File import com.rookie.submit.common.{Common, Constant}

Flink SQL任務自動生成與提交

目錄起因思路實現1.配置2.介面如下3.環境問題起因事情的起因，是看到一篇公眾號文章Apache Flink 在汽車之家的應用與實踐，裡面提到了“基於 SQL 的開發流程”。在平臺提供以上功能的基礎上，使用者可以快速的實現

Flink 環境的搭建、獨立叢集、Flink on Yarn、訪問Flink web介面、Flink提交任務的三種方式、Flink讀取HDFS上的資料

Flink 執行方式三種執行方式（與spark相似）： 1、local 本地測試 2、Standallone Cluster 獨立叢集（做實時計算，不需要hadoop，該獨立叢集可能用的上）

Docker中提交任務到Spark叢集

1. 背景描述和需求資料分析程式部署在Docker中，有一些分析計算需要使用Spark計算，需要把任務提交到Spark叢集計算。

解決 Flink 1.11.0 sql 不能指定 jobName 的問題

月初的時候，Flink 終於釋出 1.11.0 版本， CDC 的功能還是比較期待的（雖然比預期差很多）

mybatis巢狀查詢，解決分頁查詢數量與sql執行器查詢數量不一致的問題（本文內容轉貼）

表與表之之間存在關聯的時候，就可以使用巢狀查詢一個物件包含了另一個物件

Flink 1.12.0 sql 任務指定 job name

參考前文：解決 Flink 1.11.0 sql 不能指定 jobName 的問題從 FLink 1.11 改版 sql 的執行流程後，就不能和 Stream Api 一樣使用 env.execute(\"JobName\") 來指定任務名

Spark（第二節）Spark角色介紹，Spark提交任務引數解釋，分別基於spark-shell、scala、java開發單詞計數方法

技術標籤：spark 目錄 Spark角色介紹Spark提交任務引數解釋spark任務提交說明一些基本選項引數提交說明

mysql SQL注入攻擊解決Orm工具Hibernate，Mybatis， MiniDao 的 sql 預編譯語句；解決非Orm工具JDBCTemplate的

sql 預編譯語句_牛客部落格 https://blog.nowcoder.net/n/198be55df4a4406d8eb9dc2482272061?from=nowcoder_improve

使用SQLServer同義詞和SQL郵件，解決釋出訂閱中訂閱庫丟失資料的問題

最近給客戶做了基於SQLServer的釋出訂閱的“讀寫分離”功能，但是某些表資料很大，經常發生某幾條資料丟失的問題，導致訂閱無法繼續進行。但是每次發現問題重新做一次釋出訂閱又非常消耗時間，所以還得根據“複製監視

一條SQL語句提交後，db2都做了什麼？

一條SQL語句提交後，db2都做了什麼？ somenzz 微信公眾號「Python七號」和你一起精進。

Flink 系列（八）—— Flink Standalone 叢集部署

一、部署模式 Flink 支援使用多種部署模式來滿足不同規模應用的需求，常見的有單機模式，Standalone Cluster 模式，同時 Flink 也支援部署在其他第三方平臺上，如 YARN，Mesos，Docker，Kubernetes 等。以下主要介紹

Swoft 2.0.5 更新，新增高效秒級定時任務、異常管理元件

什麼是 Swoft ? Swoft 是一款基於 Swoole 擴充套件實現的 PHP 微服務協程框架。Swoft 能像 Go 一樣，內建協程網路伺服器及常用的協程客戶端且常駐記憶體，不依賴傳統的 PHP-FPM。有類似 Go 語言的協程操作方式，有類

CentOS 7.2搭建FastDFS 分散式檔案系統，實現高可用叢集

title: CentOS 7.2搭建FastDFS 分散式檔案系統，實現高可用叢集分散式叢集搭建結構

[原始碼解析]Oozie來龍去脈之提交任務

[原始碼解析]Oozie來龍去脈之提交任務 0x00 摘要 Oozie是由Cloudera公司貢獻給Apache的基於工作流引擎的開源框架，是Hadoop平臺的開源的工作流排程引擎，用來管理Hadoop作業。本文是系列的第一篇，介紹Oozie的任務提

spring boot Mybatis 攔截器，實現拼接sql和修改

定義一個 SqlIntercepor 類 import com.culturalCenter.placeManage.globalConfig.Interface.InterceptAnnotation;

僅需5步，輕鬆升級K3s叢集！

Rancher 2.4是Rancher目前最新的版本，在這一版本中你可以通過Rancher UI對K3s叢集進行升級管理。

解決：kubernetes 叢集DNS配置及容器內CoreDNS解析外部域名配置問題

近期devops過程中發現在kubernetes 中啟動Jenkins master 執行job 啟動slave時出現概率事件解析不到gitlab的域名。第一時間反射到的是dns問題，具體是DNS哪裡的配置問題慢慢刨根。

C# 獲取近十週的每週一日期，然後通過sql查出來的按周分組進行匹配，沒有則補0進行報表統計

通過sql按周統計詳見https://www.cnblogs.com/ZhengHengWU/p/13305104.html //資料庫通過sql查出按周分組的統計資料

Jquery.data資料快取，儲存上傳的檔案，供儲存時一併提交

1 <div id=\"sto\"> 2<input type=\"file\" onchange=\"upload(this)\" multiple> 3</div>

mark，解決flink sql叢集提交任務不能指定名字的問題

相關推薦