Flink SQL自定義connector

阿新 • • 發佈：2020-12-03

　　最近遇到一個反饋說系統查詢很慢，經常發生超時的問題，因系統上線比較久，部分資料表資料量比較大，常用的表少則1千多萬，多的超過1億條資料，且都是常用的表。目前想到的方案有：

分庫：報表查詢用一個庫，操作用一個庫。這樣的改動對於系統來說改動比較小，但基本無法解決超時的問題；
分表：對於報表的改動比較大，是一個備選方案；
表分割槽：看到有文章介紹說表分割槽可解決效能問題，因表分割槽不需要對業務程式碼做任何改變，基於此特性我做了個驗證。

　　關於表分割槽的操作過程可參考：

　　如果需要調整表分割槽方案可參考：

　　本次我在本機上做新建一個測試庫，並建立了 5千萬條資料，分5個表分割槽檔案測試，每個檔案1千萬條資料。

SET ANSI_NULLS ON
GO

SET QUOTED_IDENTIFIER ON
GO

CREATE TABLE [dbo].[pro_main](
    [prohid] [BIGINT] IDENTITY(1,1) NOT NULL,
    [barcodeid] [VARCHAR](50) NOT NULL,
    [createdate] [DATETIME] NOT NULL,
    [sortid] [INT] NOT NULL,
    [userid] [INT] NOT NULL,
    [realname] [VARCHAR](50) NULL,
 CONSTRAINT [PK_pro_main] PRIMARY KEY CLUSTERED 
(
    [prohid] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON, OPTIMIZE_FOR_SEQUENTIAL_KEY = OFF)
)
GO


DECLARE @i BIGINT;
SET @i = 1;
WHILE (@i <= 5000000)
BEGIN

INSERT INTO dbo.pro_main
(
    barcodeid,
    createdate,
    sortid,
    userid,
    realname
)
    VALUES
    (NEWID(), GETDATE(), @i,3421, 'gaobaosong'+ CAST(@i AS VARCHAR(10)));
    SET @i = @i + 1;
END;
GO

建立測試資料

　　用如下程式碼驗證資料分佈：

-- fn_main 為分割槽函式
SELECT COUNT(1) 數量, $partition.fn_main(prohid) 分割槽號 
FROM dbo.pro_main
GROUP BY $partition.fn_main(prohid)

檢視資料分佈

　　資料分佈都符合預期。下面我將表分割槽和不做表分割槽對比著查詢，看下實際效能如何。

-- 釋放快取
DBCC FREEPROCCACHE
DBCC FREESESSIONCACHE

-- 表分割槽的
SELECT $partition.fn_main(prohid) fc, * 
FROM dbo.pro_main WHERE barcodeid LIKE '%3752c%'

-- 未做表分割槽的
SELECT * 
FROM dbo.pro_main01 WHERE barcodeid LIKE '%3752c%'

查詢對比

　　通過查詢分析對比，他們的速度幾乎一致，有做過分割槽的甚至比未做分割槽的查詢要慢。但加上了查詢的分割槽號後表分割槽的查詢速度立馬體現出來了。

SELECT $partition.fn_main(prohid) fc, * 
FROM dbo.pro_main WHERE barcodeid LIKE '%3752c%' 
    AND $partition.fn_main(prohid) BETWEEN 2 AND 3

在分割槽中查詢

　　結論：

有文章介紹的說表分割槽查詢速度快是有前提的，即限定在某個分割槽的查詢速度會快；
在應對大體量資料的時候，表分割槽在某些場景下可能有用，但它不是萬能的。

Flink SQL自定義connector

本文翻譯自：動態表是Flink的Table＆SQL API的核心概念，用於以統一方式處理有界和無界資料。

Flink 原始碼 | 自定義 Format 消費 Maxwell CDC 資料

Flink 1.11 最重要的 Feature —— Hive Streaming 之前已經和大家分享過了，今天就和大家來聊一聊另一個特別重要的功能 —— CDC。

Flink 學習 — 自定義 Data Sink

前言前篇文章《Flink學習》—— Data Sink 介紹介紹了 Flink Data Sink，也介紹了 Flink 自帶的 Sink，那麼如何自定義自己的 Sink 呢？這篇文章將寫一個 demo

SQL自定義函式

--.自定義函式--語法： CREATE OR REPLACE FUNCTION FUN_函式名(引數1 資料型別，引數2，[IN|OUT|IN OUT] 資料型別……)

Flink基礎（四十）：FLINK SQL(十六) 函式（五）自定義函式（三）

表值聚合函式自定義表值聚合函式（UDTAGG）可以把一個表（一行或者多行，每行有一列或者多列）聚合成另一張表，結果中可以有多行多列。

Flink基礎（三十八）：FLINK SQL(十四) 函式（三）自定義函式（一）

0 簡介自定義函式（UDF）是一種擴充套件開發機制，可以用來在查詢語句裡呼叫難以用其他方式表達的頻繁使用或自定義的邏輯。

Flink基礎（三十九）：FLINK SQL(十五) 函式（四）自定義函式（二）

1 標量函式自定義標量函式可以把 0 到多個標量值對映成 1 個標量值，資料型別裡列出的任何資料型別都可作為求值方法的引數和返回值型別。

Flink基礎（66）：FLINK SQL(43) 自定義函式（二）自定義標量函式（UDF）

本文為您介紹如何為實時計算Flink版自定義標量函式（UDF）搭建開發環境、編寫業務程式碼及上線。

Flink基礎（65）：FLINK SQL(42) 自定義函式（一）概述

本文為您介紹如何搭建實時計算Flink版自定義函式的環境並使用自定義函式。

Flink基礎（69）：FLINK SQL(46) 自定義函式（五）使用IntelliJ IDEA開發自定義函式

本文為您介紹如何使用IntelliJ IDEA開發實時計算Flink版自定義函式，包括搭建開發環境和實時計算Flink版作業中引用自定義函式。

Flink基礎（68）：FLINK SQL(45) 自定義函式（四）自定義表值函式（UDTF）

本文為您介紹如何為實時計算Flink版自定義表值函式（UDTF）搭建開發環境、編寫業務程式碼以及上線。

Flink基礎（67）：FLINK SQL(44) 自定義函式（三）自定義聚合函式（UDAF）

本文為您介紹如何為實時計算Flink版自定義聚合函式（UDAF）搭建開發環境、編寫業務程式碼及上線。

FLINK例項(133):FLINK-SQL應用場景(24) CONNECTORS(24) 自定義 redis 資料維表(作為sink表)（附原始碼）

1.序篇-本文結構背景篇-為啥需要 redis 資料匯表目標篇-redis 資料匯表預期效果

SQL Server 2019下載與安裝教程(自定義安裝)

1.SQL Server2019安裝包下載 1.1進入官網 SQL Server 2019 1.2下載安裝包 1點選Continue 2.填寫個人資訊，再點選Continue

JPA自定義sql的三種方式

1：在repository介面上註解@Query引數 1：@Query(\"select o fromAgentInfoowhere o.userId = ?1 and o.balance<0\")

小書MybatisPlus第3篇-自定義SQL

本檔案為一個系列，前面章節：小書MybatisPlus第1篇-整合SpringBoot快速開始增刪改查

如何為預先資料庫建立自定義SQL Server複製

　　SyncNavigator是一款功能強大的資料庫同步軟體，適用於SQLSERVER, MySQL，具有自動/定時同步資料、無人值守、故障自動恢復、同構/異構資料庫同步、斷點續傳和增量同步等功能，支援Windows xp以上所有作業系統，

mybatis 使用自定義sql 語句

新建一個介面 SqlBaseMapper 封裝常用的增刪改查 public interface SqlBaseMapper { /** * 查詢單條資料返回Map<String, Object>

Hibernate JPA 各種自定義SQL及返回總結

我的總結基於 spring-data-jpa-2.1.15RELEASE.jar JPA代替mybatis的dao import com.dahuatech.bigfish.project.assignment.entity.AssignmentDO;import org.springframework.data.jpa.repository.JpaRepository;i

MybatisPlus自定義Sql實現多表查詢的示例

前言前段時間看同事的程式碼，發現他用Layui+MybatisPlus做分頁查詢做得很規整，認真看了下程式碼發現這種方式不僅適用於與Layui做分頁查詢，在任何時候需要多表聯查的時候都可以用到。

Flink SQL自定義connector

相關推薦