MySQL快速對比資料技巧

阿新 • • 發佈：2020-01-09

在MySQL運維中，研發同事想對比下兩個不同例項上的資料並找出差異，除主鍵外還需要對比每一個欄位，如何做呢？

第一種方案，寫程式將兩個例項上的每一行資料取出來進行對比，理論可行，但是對比時間較長。

第二種方案，對每一行資料所有欄位合併起來，取checksum值，再按照checksum值對比，看著可行，嘗試下。

首先要合併所有欄位的值，選用MySQL提供的CONCAT函式，如果CONCAT函式中包含NULL值，會導致最終結果為NULL，因此需要使用IFNULL函式來替換NULL值，如:

CONCAT(IFNULL(C1,''),IFNULL(C2,''))

加入表有很多行，手動拼個指令碼比較累，別急，可以使用information_schema.COLUMNS來處理：

## 獲取列名的拼接串
SELECT
GROUP_CONCAT('IFNULL(',COLUMN_NAME,','''')')
FROM information_schema.COLUMNS 
WHERE TABLE_NAME='table_name';

假設我們有測試表：

CREATE TABLE t_test01
(
 id INT AUTO_INCREMENT PRIMARY KEY,C1 INT,C2 INT
)

我們便可以拼接出下面的SQL:

SELECT
id,MD5(CONCAT(
IFNULL(id,IFNULL(c1,IFNULL(c2,)) AS md5_value
FROM t_test01

在兩個例項上執行下，然後把結果使用beyond compare對比下，就很容易找出不相同的行以及主鍵ID

對於資料量較大的表，執行出來的結果集也很大，對比起來比較費勁，那就先嚐試縮小結果集，可以將多行記錄的md5值合併起來求MD5值，如果最後MD5值相同，則這些行相同，如果不同，則證明存在差異，再按照這些行進行逐行對比。

假設我們按照1000行一組來進行對比，如果需要將分組後的結果合併，需要使用GROUP_CONCAT函式，注意在GROUP_CONCAT函式中新增排序保證合併資料的順序， SQL如下：

SELECT
min(id) as min_id,max(id) as max_id,count(1) as row_count,MD5(GROUP_CONCAT(
MD5(CONCAT(
IFNULL(id,)) ORDER BY id
))AS md5_value
FROM t_test01
GROUP BY (id div 1000)

執行結果為：

min_id  max_id  row_count  md5_value
0    999    1000     7d49def23611f610849ef559677fec0c
1000   1999    1000     95d61931aa5d3b48f1e38b3550daee08
2000   2999    1000     b02612548fae8a4455418365b3ae611a
3000   3999    1000     fe798602ab9dd1c69b36a0da568b6dbb

當差異資料較少時，即使需要對比上千萬資料，我們可以輕鬆根據根據min_id和max_id來快速定位到哪1000條資料裡存在差異，再進行逐行MD5值對比，最終找到差異行。

最終對比圖：

PS:

在使用GROUP_CONCAT時，需要配置MySQL變數group_concat_max_len，預設值為1024，超出部分會被階段。

MySQL快速對比資料技巧

在MySQL運維中，研發同事想對比下兩個不同例項上的資料並找出差異，除主鍵外還需要對比每一個欄位，如何做呢？

面試官: 兩個Redis例項怎麼快速對比哪些資料不一致

最近又在翻黃老師的《Redis 設計與實現》，想到幾道面試題結合實際生產過程中的一些步驟作為總結

MySql 快速插入千萬級大資料的方法示例

在資料分析領域，資料庫是我們的好幫手。不僅可以接受我們的查詢時間，還可以在這基礎上做進一步分析。所以，我們必然要在資料庫插入資料。在實際應用中，我們經常遇到千萬級，甚至更大的資料量。如果沒有一個快速的

MySQL 快速刪除大量資料（千萬級別）的幾種實踐方案

筆者最近工作中遇見一個效能瓶頸問題，MySQL表，每天大概新增776萬條記錄，儲存週期為7天，超過7天的資料需要在新增記錄前老化。連續執行9天以後，刪除一天的資料大概需要3個半小時（環境：128G, 32核，4T硬碟），而

MySQL 快速刪除大量資料（千萬級別）的幾種實踐方案詳解

筆者最近工作中遇見一個性能瓶頸問題，MySQL表，每天大概新增776萬條記錄，儲存週期為7天，超過7天的資料需要在新增記錄前老化。連續執行9天以後，刪除一天的資料大概需要3個半小時（環境：128G,32核，4T硬碟），而

MySQL 之 LOAD DATA INFILE 快速匯入資料 (單表資料很大)

SELECT INTO OUTFILE LOAD DATA INFILE mysqlimport SELECT INTO OUTFILE > help select; Name: \'SELECT\' Description:

MySQL如何快速匯入資料

前言：日常學習和工作中，經常會遇到導資料的需求。比如資料遷移、資料恢復、新建從庫等，這些操作可能都會涉及大量資料的匯入。有時候匯入進度慢，電腦風扇狂轉真的很讓人崩潰，其實有些小技巧是可以讓匯入更快速

mysql快速匯入大量資料問題

思路一：今天需要把將近存有一千萬條記錄的*.sql匯入到mysql中。使用navicate匯入，在匯入100萬條之後速度就明顯變慢了，

mybatisPlus下mysql轉sqlServer 資料遷移和語法對比

mybatisPlus下mysql轉sqlServer 資料遷移和語法對比一.mysql資料遷移到sqlServer2008中(包括資料結構和資料)

MySQL資料庫主從資料對比

1. 工具安裝使用percona-Toolkit進行資料對比，因此先進行此工具的安裝官方地址：

Mysql快速插入千萬條資料的實戰教程---轉

一.建立資料庫二.建立表1.建立dept表CREATETABLE`dept`(`id`int(11)NOTNULL,`deptno`mediumint(9)DEFAULTNUL...

MySQL快速複製資料庫資料表的方法 CREATE TABLE new_table SELECT * FROM old_table; Copy表(建立表並複製資料)

MySQL快速複製資料庫資料表的方法https://www.jb51.net/article/73186.htm Copy表(建立表並複製資料) CREATE TABLEnew_tableSELECT*FROMold_table;

mysql 快速複製表結構、表資料

1.情景展示如何對A表表資料進行快速複製？如何只對A表表結構進行快速複製？

通過一分鐘快速瞭解索引技巧

花1分鐘時間，瞭解聚集索引，非聚集索引，聯合索引，索引覆蓋。舉例，業務場景，使用者表，表結構為：

Mysql資料庫中資料表的優化、外來鍵與三正規化用法例項分析

本文例項講述了Mysql資料庫中資料表的優化、外來鍵與三正規化用法。分享給大家供大家參考，具體如下：

mysql快速獲得庫中無主鍵的表例項程式碼

概述總結一下MySQL資料庫檢視無主鍵表的一些sql,一起來看看吧~ 1、查看錶主鍵資訊

mysql索引使用率監控技巧（值得收藏！）

概述在關係資料庫中，索引是一種單獨的、物理的對資料庫表中一列或多列的值進行排序的一種儲存結構，它是某個表中一列或若干列值的集合和相應的指向表中物理標識這些值的資料頁的邏輯指標清單。

Mysql時間軸資料獲取同一天資料的前三條

建立表資料 CREATE TABLE `praise_info` ( `id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT \'ID\',`pic_id` varchar(64) DEFAULT NULL COMMENT \'圖片ID\',`created_time` datetime DEFAULT CURRENT_TIMESTAMP

基於Docker結合Canal實現MySQL實時增量資料傳輸功能

Canal的介紹 Canal的歷史由來在早期的時候，阿里巴巴公司因為杭州和美國兩個地方的機房都部署了資料庫例項，但因為跨機房同步資料的業務需求，便孕育而生出了Canal，主要是基於trigger（觸發器）的方式獲取增量變

使用python將mysql資料庫的資料轉換為json資料的方法

由於產品運營部需要採用第三方個推平臺，來推送訊息。如果手動一個個鍵入欄位和欄位值，容易出錯，且非常繁瑣，需要將mysql的資料轉換為json資料，直接複製即可。

MySQL快速對比資料技巧

相關推薦