sharding-jdbc之ANTLR4 SQL解析

Sharding主要利用ANTLR4來解析SQL，以mysql為例，分析原始碼前可以先了解以下三點：

antlr4，如何編寫 .g4 語法檔案
mysql 語法可以參考https://dev.mysql.com/doc/refman/8.0/en/sql-syntax-data-manipulation.html
mysql g4檔案編寫可以參考https://github.com/antlr/grammars-v4/blob/master/mysql

原始碼分析

1.解析入口ParsingSQLRouter#parse

    /**
     * 解析sql
     * 
     * @param logicSQL 邏輯sql
     * @param useCache 是否快取解析後的結果
     * @return
     */
    @Override
    public SQLStatement parse(final String logicSQL, final boolean useCache) {
        //解析前鉤子，如:呼叫鏈etx
        parsingHook.start(logicSQL);
        try {
            //解析SQL
            SQLStatement result = new ShardingSQLParseEntry(databaseType, shardingMetaData.getTable(), parsingResultCache).parse(logicSQL, useCache);
            //解析成功後鉤子
            parsingHook.finishSuccess(result, shardingMetaData.getTable());
            return result;
            // CHECKSTYLE:OFF
        } catch (final Exception ex) {
            // CHECKSTYLE:ON
            //解析失敗鉤子
            parsingHook.finishFailure(ex);
            throw ex;
        }
    }

public final class ShardingSQLParseEntry extends SQLParseEntry {
    
    private final DatabaseType databaseType;
    
    private final ShardingTableMetaData shardingTableMetaData;
    
    public ShardingSQLParseEntry(final DatabaseType databaseType, final ShardingTableMetaData shardingTableMetaData, final ParsingResultCache parsingResultCache) {
        super(parsingResultCache);
        this.databaseType = databaseType;
        this.shardingTableMetaData = shardingTableMetaData;
    }

    /**
     * 根據sql獲取解析引擎封裝物件
     */
    @Override
    protected SQLParseEngine getSQLParseEngine(final String sql) {
        //引數1：單例，載入statement、提取、過濾配置檔案
        //引數2：資料庫型別
        //引數3：需要解析sql
        //引數4：分片表元資料
        return new SQLParseEngine(ShardingParseRuleRegistry.getInstance(), databaseType, sql, shardingTableMetaData);
    }
}

2.ShardingParseRuleRegistry.getInstance()->ParseRuleRegistry#initParseRuleDefinition載入statement、提取、過濾配置檔案

private void initParseRuleDefinition() {
        //利用JAXB載入META-INF/parsing-rule-definition/extractor-rule-definition.xml配置檔案
        ExtractorRuleDefinitionEntity generalExtractorRuleEntity = extractorRuleLoader.load(RuleDefinitionFileConstant.getExtractorRuleDefinitionFile());
        //利用JAXB載入下META-INF/parsing-rule-definition/filler-rule-definition.xml配置檔案
        FillerRuleDefinitionEntity generalFillerRuleEntity = fillerRuleLoader.load(RuleDefinitionFileConstant.getFillerRuleDefinitionFile());
        //加對應型別(sharding、masterslave、encrypt)配置檔案
        //META-INF/parsing-rule-definition/sharding/filler-rule-definition.xml
        FillerRuleDefinitionEntity featureGeneralFillerRuleEntity = fillerRuleLoader.load(RuleDefinitionFileConstant.getFillerRuleDefinitionFile(getType()));
        //根據資料庫型別載入對應的配置檔案
        for (DatabaseType each : SQLParserFactory.getAddOnDatabaseTypes()) {
            //META-INF/parsing-rule-definition/sharding.mysql/filler-rule-definition.xml
            //databaseType:rules<segment,filler>
            fillerRuleDefinitions.put(each, createFillerRuleDefinition(generalFillerRuleEntity, featureGeneralFillerRuleEntity, each));
            //META-INF/parsing-rule-definition/sharding.mysql/extractor-rule-definition.xml
            //META-INF/parsing-rule-definition/sharding.mysql/sql-statement-rule-definition.xml
            //databaseType:rules<xxxContext,SQLStatementRule>
            sqlStatementRuleDefinitions.put(each, createSQLStatementRuleDefinition(generalExtractorRuleEntity, each));
        }
    }
    
    private FillerRuleDefinition createFillerRuleDefinition(final FillerRuleDefinitionEntity generalFillerRuleEntity,
                                                            final FillerRuleDefinitionEntity featureGeneralFillerRuleEntity, final DatabaseType databaseType) {
        return new FillerRuleDefinition(
                generalFillerRuleEntity, featureGeneralFillerRuleEntity, fillerRuleLoader.load(RuleDefinitionFileConstant.getFillerRuleDefinitionFile(getType(), databaseType)));
    }
    
    private SQLStatementRuleDefinition createSQLStatementRuleDefinition(final ExtractorRuleDefinitionEntity generalExtractorRuleEntity, final DatabaseType databaseType) {
        //將所有提取器封裝到一起
        //id:extractor
        ExtractorRuleDefinition extractorRuleDefinition = new ExtractorRuleDefinition(
                generalExtractorRuleEntity, extractorRuleLoader.load(RuleDefinitionFileConstant.getExtractorRuleDefinitionFile(getType(), databaseType)));
        //sql-statement-rule-definition.xml
        //Context:SQLStatementRule
        //SQLStatementRule封裝statement對應的提取器
        return new SQLStatementRuleDefinition(statementRuleLoader.load(RuleDefinitionFileConstant.getSQLStatementRuleDefinitionFile(getType(), databaseType)), extractorRuleDefinition);
    }

3.SQLParseEntry#parse，這裡抽象SQLParseEntry，主要有不同入口（EncryptSQLParseEntry、MasterSlaveSQLParseEntry、ShardingSQLParseEntry）

@RequiredArgsConstructor
public abstract class SQLParseEntry {
    
    private final ParsingResultCache parsingResultCache;
    
    /**
     * Parse SQL.
     *
     * @param sql SQL
     * @param useCache use cache or not
     * @return SQL statement
     */
    public final SQLStatement parse(final String sql, final boolean useCache) {
        //從快取中獲取解析後的SQLStatement
        Optional<SQLStatement> cachedSQLStatement = getSQLStatementFromCache(sql, useCache);
        if (cachedSQLStatement.isPresent()) {
            return cachedSQLStatement.get();
        }
        //解析
        SQLStatement result = getSQLParseEngine(sql).parse();
        //cache
        if (useCache) {
            parsingResultCache.put(sql, result);
        }
        return result;
    }
    
    private Optional<SQLStatement> getSQLStatementFromCache(final String sql, final boolean useCache) {
        return useCache ? Optional.fromNullable(parsingResultCache.getSQLStatement(sql)) : Optional.<SQLStatement>absent();
    }

    //根據子類ShardingSQLParseEntry的getSQLParseEngine獲取SQLParseEngine
    protected abstract SQLParseEngine getSQLParseEngine(String sql);
}

4.SQLParseEngine#parse，包含解析、提取、填充SQLStatement

public SQLParseEngine(final ParseRuleRegistry parseRuleRegistry, final DatabaseType databaseType, final String sql, final ShardingTableMetaData shardingTableMetaData) {
        DatabaseType trunkDatabaseType = DatabaseTypes.getTrunkDatabaseType(databaseType.getName());
        //sql解析引擎
        parserEngine = new SQLParserEngine(parseRuleRegistry, trunkDatabaseType, sql);
        //sql提取引擎
        extractorEngine = new SQLSegmentsExtractorEngine();
        //sql填充引擎
        fillerEngine = new SQLStatementFillerEngine(parseRuleRegistry, trunkDatabaseType, sql, shardingTableMetaData);
    }
    
    /**
     * Parse SQL.
     *
     * @return SQL statement
     */
    public SQLStatement parse() {
        //利用ANTLR4 解析sql
        SQLAST ast = parserEngine.parse();
        //提取ast中的token，封裝成對應的segment，如TableSegment、IndexSegment
        Collection<SQLSegment> sqlSegments = extractorEngine.extract(ast);
        Map<ParserRuleContext, Integer> parameterMarkerIndexes = ast.getParameterMarkerIndexes();
        //填充SQLStatement
        return fillerEngine.fill(sqlSegments, parameterMarkerIndexes.size(), ast.getSqlStatementRule());
    }

5.SQLParserEngine#parse，解析SQL，封裝AST(Abstract Syntax Tree 抽象語法樹)

public SQLAST parse() {
        //SPI 利用ANTLR4解析獲取SQLParser(MySQLParserEntry)執行，獲取解析樹
        ParseTree parseTree = SQLParserFactory.newInstance(databaseType, sql).execute().getChild(0);
        if (parseTree instanceof ErrorNode) {
            throw new SQLParsingException(String.format("Unsupported SQL of `%s`", sql));
        }
        //獲取配置檔案中的StatementContext，比如CreateTableContext、SelectContext
        SQLStatementRule sqlStatementRule = parseRuleRegistry.getSQLStatementRule(databaseType, parseTree.getClass().getSimpleName());
        if (null == sqlStatementRule) {
            throw new SQLParsingException(String.format("Unsupported SQL of `%s`", sql));
        }
        //封裝ast(Abstract Syntax Tree 抽象語法樹)
        return new SQLAST((ParserRuleContext) parseTree, getParameterMarkerIndexes((ParserRuleContext) parseTree), sqlStatementRule);
    }

    /**
     * 遞迴獲取所有引數佔位符
     *
     * @param rootNode 根節點
     * @return
     */
    private Map<ParserRuleContext, Integer> getParameterMarkerIndexes(final ParserRuleContext rootNode) {
        Collection<ParserRuleContext> placeholderNodes = ExtractorUtils.getAllDescendantNodes(rootNode, RuleName.PARAMETER_MARKER);
        Map<ParserRuleContext, Integer> result = new HashMap<>(placeholderNodes.size(), 1);
        int index = 0;
        for (ParserRuleContext each : placeholderNodes) {
            result.put(each, index++);
        }
        return result;
    }

6.使用SQLParserFactory#newInstance建立SQLParser

    /** 
     * New instance of SQL parser.
     * 
     * @param databaseType database type
     * @param sql SQL
     * @return SQL parser
     */
    public static SQLParser newInstance(final DatabaseType databaseType, final String sql) {
        //SPI load所有擴充套件
        for (SQLParserEntry each : NewInstanceServiceLoader.newServiceInstances(SQLParserEntry.class)) {
            //判斷資料庫型別
            if (DatabaseTypes.getActualDatabaseType(each.getDatabaseType()) == databaseType) {
                //解析sql
                return createSQLParser(sql, each);
            }
        }
        throw new UnsupportedOperationException(String.format("Cannot support database type '%s'", databaseType));
    }
    
    @SneakyThrows
    private static SQLParser createSQLParser(final String sql, final SQLParserEntry parserEntry) {
        //詞法分析器
        Lexer lexer = parserEntry.getLexerClass().getConstructor(CharStream.class).newInstance(CharStreams.fromString(sql));
        //語法分析器
        return parserEntry.getParserClass().getConstructor(TokenStream.class).newInstance(new CommonTokenStream(lexer));
    }

7.以select為例，分析第四步的SQL解析、提取、填充過程

利用idea的antlr4外掛，使用Sharding的mysql .g4 檔案解析SQL；如圖：

參考上圖，使用sharding parse解析模組提取(extractor) ParserRuleContext對應的引數封裝成Segment

8.SQLSegmentsExtractorEngine#extract，參考第七部圖，根據SQLStatementRule->tableReferences, columns, selectItems, where, predicate, groupBy, orderBy, limit, subqueryPredicate對應的提取器，生成對應型別的Segment

public final class SQLSegmentsExtractorEngine {
    
    /** 
     * Extract SQL segments.
     * 
     * @param ast SQL AST
     * @return SQL segments
     */
    public Collection<SQLSegment> extract(final SQLAST ast) {
        Collection<SQLSegment> result = new LinkedList<>();
        //遍歷Context對應提取器，封裝成對應對應型別的Segment，比如TableSegment、IndexSegment
        //以SELECT i.* FROM t_order o, t_order_item i WHERE o.order_id = i.order_id and o.order_id = ?為例

        //SelectContext->SQLStatementRule

        //SQLStatementRule->tableReferences, columns, selectItems, where, predicate, groupBy, orderBy, limit, subqueryPredicate
        //分析九個提取器
        for (SQLSegmentExtractor each : ast.getSqlStatementRule().getExtractors()) {
            //分兩種型別
            //1.單一樹，直接提取單一RuleName下的token；參看sql解析後的語法樹對比比較清晰
            if (each instanceof OptionalSQLSegmentExtractor) {
                Optional<? extends SQLSegment> sqlSegment = ((OptionalSQLSegmentExtractor) each).extract(ast.getParserRuleContext(), ast.getParameterMarkerIndexes());
                if (sqlSegment.isPresent()) {
                    result.add(sqlSegment.get());
                }
            //2.分叉樹，需遍歷提取RuleName下的所有Token；參看sql解析後的語法樹對比比較清晰
            } else if (each instanceof CollectionSQLSegmentExtractor) {
                result.addAll(((CollectionSQLSegmentExtractor) each).extract(ast.getParserRuleContext(), ast.getParameterMarkerIndexes()));
            }
        }
        return result;
    }
}

9.SQLStatementFillerEngine#fill，封裝SQLStatement，填充Segment

@RequiredArgsConstructor
public final class SQLStatementFillerEngine {
    
    private final ParseRuleRegistry parseRuleRegistry;
    
    private final DatabaseType databaseType;
    
    private final String sql;
    
    private final ShardingTableMetaData shardingTableMetaData;
    
    /**
     * Fill SQL statement.
     *
     * @param sqlSegments SQL segments
     * @param parameterMarkerCount parameter marker count
     * @param rule SQL statement rule
     * @return SQL statement
     */
    @SneakyThrows
    public SQLStatement fill(final Collection<SQLSegment> sqlSegments, final int parameterMarkerCount, final SQLStatementRule rule) {
        //如SelectStatement
        SQLStatement result = rule.getSqlStatementClass().newInstance();
        //邏輯sql
        result.setLogicSQL(sql);
        //引數個數
        result.setParametersCount(parameterMarkerCount);
        //segment
        result.getSQLSegments().addAll(sqlSegments);
        //遍歷填充對應型別的Segment
        for (SQLSegment each : sqlSegments) {
            //根據資料庫型別、segment找到對應填充器，來填充對應的segment
            //如：TableSegment->TableFiller
            Optional<SQLSegmentFiller> filler = parseRuleRegistry.findSQLSegmentFiller(databaseType, each.getClass());
            if (filler.isPresent()) {
                doFill(each, result, filler.get());
            }
        }
        return result;
    }
    
    @SuppressWarnings("unchecked")
    private void doFill(final SQLSegment sqlSegment, final SQLStatement sqlStatement, final SQLSegmentFiller filler) {
        //新增欄位、欄位約束、修改欄位、欄位命令，這四種填充器需要設定分片表元資料
        //主要通過分片表元資料來填充對應的SQLStatement
        if (filler instanceof ShardingTableMetaDataAware) {
            ((ShardingTableMetaDataAware) filler).setShardingTableMetaData(shardingTableMetaData);
        }
        //如:
        //利用TableFill來填充SelectStatement#tables
        filler.fill(sqlSegment, sqlStatement);
    }
}

以上Sharding的SQL解析大概過程，解析ParserRuleContext提取封裝對應的Segment，最後封裝SQLStatement，並根據Segment對應的Filler來填充SQLStatement；具體如何提取、填充可以檢視以下三個檔案

extractor-rule-definition.xml
filler-rule-definition.xml
sql-statement-rule-definition.xml

相關推薦

sharding-jdbc之ANTLR4 SQL解析

Sharding主要利用ANTLR4來解析SQL，以mysql為例，分析原始碼前可以先了解以下三點： antlr4，如何編

資料庫中介軟體 Sharding-JDBC 原始碼分析 —— SQL 解析（三）之查詢SQL

��關注微信公眾號：【芋艿的後端小屋】有福利： 1. RocketMQ / MyCAT / Sharding-JDBC 所有原始碼分析文章列表 2. RocketMQ / MyCAT / Sharding-JDBC 中文註釋原始碼

資料庫中介軟體 Sharding-JDBC 原始碼分析 —— SQL 解析（一）之詞法解析

本文主要基於 Sharding-JDBC 1.5.0 正式版 ��關注微信公眾號：【芋道原始碼】有福利： 1. RocketMQ / MyCAT / Sharding-JDBC 所有原始碼分析文章列表 2. Roc

資料庫中介軟體 Sharding-JDBC 原始碼分析 —— SQL 解析（六）之刪除SQL

本文主要基於 Sharding-JDBC 1.5.0 正式版 ��關注微信公眾號：【芋道原始碼】有福利： 1. RocketMQ / MyCAT / Sharding-JDBC 所有原始碼分析文章列表 2. Roc

sharding jdbc之解析引擎

圖片分詞器 span DPoS soft name parsing nchar shu 1. 解析引擎解析過程分為詞法解析和語法解析。解析引擎在 parsing 包下，包含兩大組件： Lexer：詞法解析器。 Parser：SQL解析器。詞法解析器用於將SQL拆

處理Sharding-jdbc不支援sql

在使用分表的專案中，我們可能只是對資料庫中一張或兩張表進行分表分庫處理，其餘表依然按照正常的處理邏輯。若此時所有的表的操作都交給sharding處理的話，其一是效率會受到很大的影響，其二是sharding jdbc會不支援很多sql的寫法。在這裡為了

sharding-jdbc之——分庫分表例項

一、概述之前，我們介紹了利用Mycat進行分庫分表操作，Mycat分表操作是利用分庫來進行的，單個庫中的分表操作可結合MySQL的分割槽進行，這也是Mycat官方提倡的方式。那麼，如何利用Mycat真正實現資料庫的分庫分表，可以私信我。今天，我們來看看sharding-jdb

sharding-jdbc之執行

【引用官網】為每個分片查詢維持一個獨立的資料庫連線，可以更加有效的利用多執行緒來提升執行效率。為每個資料庫連線開啟獨立的執行緒，可

數據庫中間件 Sharding-JDBC 源碼分析 —— SQL 解析（一）之語法解析

sharding-jdbc關註微信公眾號：【芋艿的後端小屋】有福利：RocketMQ / MyCAT / Sharding-JDBC 所有源碼分析文章列表RocketMQ / MyCAT / Sharding-JDBC 中文註釋源碼 GitHub 地址您對於源碼的疑問每條留言都將得到認真回復。甚至不知道如何讀

數據庫分庫分表中間件 Sharding-JDBC 源碼分析 —— SQL 解析（六）之刪除SQL

java 後端架構數據庫中間件關註微信公眾號：【芋道源碼】有福利：RocketMQ / MyCAT / Sharding-JDBC 所有源碼分析文章列表RocketMQ / MyCAT / Sharding-JDBC 中文註釋源碼 GitHub 地址您對於源碼的疑問每條留言都將得到認真回復。甚至不知道如

sharding-jdbc系列之SQL執行（六）

前言在前面我們介紹，通過SQL路由找到具體的執行表，通過SQL改寫生成具體的執行SQL，拿到具體的結果之後，sharding-jdbc下一步是幹嘛呢，下一步當然是SQL執行了。 route 程式碼入口： com.dangdang.ddframe.rdb.sh

分布式數據庫中間件之sharding-jdbc

sta math 進行 turn 使用 opened pri import 是我小編今天在做Sharding-jdbc時出現了一些問題，就上網百一百，發現網上的sharding-jdbc的參考是挺少的，唉還是要繼續學習看文檔。 Sharding-jdbc介紹 Shardi

MySQL內核源碼解讀-SQL解析之解析器淺析

ado limit ast group 指令 short ring token erl MYSQL服務器接收SQL格式的查詢，首先要對sql進行解析，內部將文本格式轉換為二進制結構，這個轉換就是解析器，解析的目的是為了讓優化器更好的處理指令，以便以最優的路徑，最少的耗時返回

Sharding-JDBC 3.x 原理篇之基本介紹（一）

簡介 Sharding-JDBC是噹噹開源的資料庫水平切分的中介軟體，其代表了客戶端類的分庫分表技術框架（這一點與MyCat不同，MyCat本質上是一種資料庫代理）。Sharding-JDBC定位為輕量級資料庫驅動，由客戶端直連資料庫，以jar包形式提供服務，未

Sharding-JDBC 3.x 原理篇之基本介紹（二）附1.x~3.x版本文件

前言上一篇描述了Sharding-JDBC的歷史演進過程和設計理念，本篇將具體描述Sharding-Sphere的具體功能和個版本特性。後續將對常用核心功能逐一進行分析和探討。版本功能 1.x功能列表分庫分表 SQL解析功能完善，支援聚合，分組，排序，LI

elasticsearch-query-tookit一款基於SQL查詢elasticsearch程式設計工具包，支援SQL解析生成DSL，支援JDBC驅動，支援和Spring、MyBatis整合

`elasticsearch-query-tookit`是一款基於SQL查詢elasticsearch程式設計工具包，支援SQL解析生成DSL，支援JDBC驅動，支援和Spring、MyBatis整合，提供Java程式設計介面可基於此工具包二次開發只是重新造了個輪子，

非規範SQL的sharding-jdbc實踐

在《“分庫分表" ？選型和流程要慎重，否則會失控》中，我們談到處於驅動層的sharding-jdbc。開源做到這個水平，已經超棒了，不像tddl成了個太監。但還是有坑。不過不能怪框架，畢竟有些sql，只有程式和鬼能懂。 <select id="getCodes" resultMap="B

sharding-jdbc原始碼閱讀之soft transaction

先看一段作者張亮，對sharding-jdbc分散式事務理解：張亮：分散式事務這塊，我們認為XA多階段提交的方式，雖然對分散式資料的完整性有比較好的保障，但會極大的降影響應用效能，並未考慮採用。我們採用的是兩種方式，一種稱之為弱XA，另一種是柔性事務，即BA

輕量級資料庫中介軟體利器Sharding-JDBC深度解析

講師介紹張亮噹噹架構部總監負責分散式中介軟體和私有云平臺建設目前主導開源專案：Elastic-Job及Sharding-JDBC 主題簡介： 1、關係型資料庫中介軟體核心功能介紹 2、Sharding-JDBC架構及核心解析 3、Sharding-JDBC未來展望一、關係型資料庫中介

深入解析：由SQL解析失敗看開發與DBA的效能之爭

編者注：在很多生產系統中，程式設計師經意不經意寫下的一條SQL都可能帶來效能上的巨大隱患，正確的、不正確的。而DBA就要不斷在這些問題中出生入死，本案例描述的那些不正確的SQL可能給我們帶來的麻煩，而這類錯誤SQL往往為大家所忽視。這樣的問題在最近的客戶案例中不斷湧現，在12c中同樣為我們帶來麻煩，