如何從資料庫層面檢測兩表內容的一致性

阿新 • • 發佈：2019-02-04

一般來說呢，如何檢測兩張表的內容是否一致，這樣的需求大多在從機上體現，以保證資料一致性。方法無非有兩個，第一呢就是從資料庫著手，第二呢就是從應用程式端著手。我這裡羅列了些如何從資料庫層面來解決此類問題的方法。
當然第一步就是檢查記錄數是否一致，否則不用想任何其他方法了。
這裡我們用兩張表t1_old,t1_new來演示。

表結構：
 CREATE TABLE t1_old (
  id int(11) NOT NULL,
  log_time timestamp DEFAULT NULL
) ;




 CREATE TABLE t1_new (
  id int(11) NOT NULL,
  log_time timestamp DEFAULT NULL
) ;


兩表的記錄數都為100條。
mysql> select count(*) from t1_old;
+----------+
| count(*) |
+----------+
|      100 |
+----------+
1 row in set (0.31 sec)


mysql> select count(*) from t1_new;
+----------+
| count(*) |
+----------+
|      100 |
+----------+
1 row in set (0.00 sec)

方法一：用加法然後去重。

由於Union 本身具備把上下兩條連線的記錄做唯一性排序，所以這樣檢測來的非常簡單。
mysql> select count(*) from (select * from t1_old union select * from t1_new) as T;
+----------+
| count(*) |
+----------+
|      100 |
+----------+
1 row in set (0.06 sec)
這裡的記錄數為100，初步證明兩表內容一致。但是，這個方法有個BUG，在某些情形下不能簡單表示結果集一致。
比如：


mysql> create table t1_old1 (id int);
Query OK, 0 rows affected (0.27 sec)


mysql> create table t1_new1(id int);
Query OK, 0 rows affected (0.09 sec)


mysql> insert into t1_old1 values (1),(2),(3),(5);
Query OK, 4 rows affected (0.15 sec)
Records: 4  Duplicates: 0  Warnings: 0


mysql> insert into t1_new1 values (2),(2),(3),(5);    
Query OK, 4 rows affected (0.02 sec)
Records: 4  Duplicates: 0  Warnings: 0


mysql> select * from t1_old1;
+------+
| id   |
+------+
|    1 |
|    2 |
|    3 |
|    5 |
+------+
4 rows in set (0.00 sec)


mysql> select * from t1_new1;
+------+
| id   |
+------+
|    2 |
|    2 |
|    3 |
|    5 |
+------+
4 rows in set (0.00 sec)


mysql> select count(*) from (select * from t1_old1 union select * from t1_new1) as T;
+----------+
| count(*) |
+----------+
|        4 |
+----------+
1 row in set (0.00 sec)


mysql> 
所以在這點上，這個方法等於是無效。

方法二：用減法來歸零。

由於MySQL 沒有提供減法操作符，這裡我們換做PostgreSQL來檢測。
t_girl=# select count(*) from (select * from t1_old except select * from t1_new) as T;
 count 
-------
     0
(1 row)


Time: 1.809 ms
這裡檢測出來結果是0，那麼證明兩表的內容一致。 那麼我們可以針對第一種方法提到的另外一種情況做檢測:
t_girl=# select count(*) from (select * from t1_old1 except select * from t1_new1) as T;
 count 
-------
     1
(1 row)


Time: 9.837 ms
OK，這裡檢測出來結果不對，那麼就直接給出不一致的結論。

第三種：用全表JOIN，這個也是最爛的做法了，當然我這裡指的是在表記錄數超級多的情形下。

當然這點我也用PostgreSQL來演示
t_girl=# select count(*) from t1_old as a full outer join t1_new as b using (id,log_time) where a.id is null or b.id is null; 
 count 
-------
     0
(1 row)


Time: 5.002 ms
t_girl=# 
結果為0，證明內容一致。

第四種：用checksum校驗。

比如在MySQL 裡面，如果兩張表的checksum值一致，那麼內容也就一致。


mysql> checksum table t1_old;
+---------------+----------+
| Table         | Checksum |
+---------------+----------+
| t_girl.t1_old | 60614552 |
+---------------+----------+
1 row in set (0.00 sec)


mysql> checksum table t1_new;
+---------------+----------+
| Table         | Checksum |
+---------------+----------+
| t_girl.t1_new | 60614552 |
+---------------+----------+
1 row in set (0.00 sec)


但是這種方法也只侷限於兩表結構一摸一樣。 比如，我修改下表t1_old的欄位型別，那麼checksum的值也就不一樣了。


mysql> alter table t1_old modify id bigint;
Query OK, 100 rows affected (0.23 sec)
Records: 100  Duplicates: 0  Warnings: 0


mysql> checksum table t1_old;
+---------------+------------+
| Table         | Checksum   |
+---------------+------------+
| t_girl.t1_old | 3211623989 |
+---------------+------------+
1 row in set (0.00 sec)


mysql> checksum table t1_new;
+---------------+----------+
| Table         | Checksum |
+---------------+----------+
| t_girl.t1_new | 60614552 |
+---------------+----------+
1 row in set (0.00 sec)

所以從上面幾種資料庫提供的方法來看，用減法來歸零相對來說比較可靠，其他的方法比較適合在特定的情形下來檢測。

如何從資料庫層面檢測兩表內容的一致性

一般來說呢，如何檢測兩張表的內容是否一致，這樣的需求大多在從機上體現，以保證資料一致性。方法無非有兩個，第一呢就是從資料庫著手，第二呢就是從應用程式端著手。我這裡羅列了些如何從資料庫層面來解決此類問題的方法。當然第一步

如何使用Amazon Rekognition從Ruby中檢測圖像內容？

env 自動識別 size bsp 戶外 ins 腳本 eas 分析 Rekognition是一種新的亞馬遜網絡服務，"它能使您可以輕松地將圖像分析添加到應用程序中"。同時，Rekognition可以檢測臉部和對象，甚至可以設置面部儲存庫以供將來識別。如果您曾

Java 從資料庫中匯出 Excle 表

目錄一、效果圖二、excle 生成的工具類原理三、excle 生成的工具類原始碼四、在 Controller 層中如何使用？五、測試一、效果圖二、excle 生成的工具類原理通過呼叫工具類，先判斷在伺服器中指定的資料夾中有沒

從資料庫層面理解：隨機 I/O & 順序 I/O

通常、我們把 <=16KB 的I/O認為是小I/O、而 >=32KB 的I/O認為是大I/O 瞭解I/O的大小、影響到後期對快取、RAID型別、LUN的一些屬性的調優當前大多數資料庫使用的都是傳統的機械磁碟因此、整個系

Oracle資料庫中刪除兩表中相同資料

--問題提出： --1、在做資料轉儲業務的時候，如果發生操作錯誤，有可能出現主表和副表中都有同一種資料， --這樣結算的結果就有可能發生錯誤。 --實現方法： --建表a create table a ( 　bm char(4),　mc varchar2(20)); -

laravel關聯兩個表內容取出的辦法

facades tab article port min lar aca 關聯取出 use Illuminate\Support\Facades\DB; $articles = DB::table(‘articles‘)->join(‘category‘,‘arti

VBA二次學習筆記（2）——兩個Excel表內容比較

integer then 控制圖片 amp 員工工作表格獲取說明（2018-9-3 22:38:58）： 1. 就是之前問同事要來的作業，有兩個格式一樣的Excel文件，一個是正確答案，一個是員工作答的。通過代碼將兩個文件進行比對，把不同之處列出來。正文： S

SQL技巧兩則：選擇一個表的字段插入另一個表，根據其它表的字段更新本表內容

name 一個表 res color 成了 from style 策略內容最近，在作django數據表遷移時用到的。因為在django中，我把本來一個字符型字段，更改成了外鍵，於是，哦喝~~~字符型字段相當於被刪除了，為了能導入這些字段的外鍵信息，於是出此下

SQL與eclipse的連線，從資料庫讀取表資料，將二維陣列資料匯入表

示例： import java.util.List; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.Statement; impor

從資料庫表中隨機獲取N條記錄的SQL語句

Oracle: select * from (select * from tableName order by dbms_random.value) where rownum < N; M

pymysql連線資料庫，讀取表內容

python中有MySQLdb、pymysql等資料庫模組，本文用pymysql模組連線mysql資料庫，並且讀取資料庫表看過其他博文的介紹，把程式和資料庫比作兩個目的地，將遊標比喻成運輸貨車很是形象生動！我用的是Anaconda的編輯器spyder，首先要先下載pymysql模組到本地才能匯

資料庫思想——兩表連線迴圈查出產品個數

這是啟用記錄表：這是啟用型別表：啟用記錄表裡面有啟用人的id，我想查啟用人光頭強激活了多少合夥人，多少一星酵王，多少二星酵王…… 在不寫死的情況下怎麼迴圈查出當前使用者每個產品型別都激活了多少人呢？控制器寫法(tp3)： public fun

sql server從資料庫表中讀取不同的日期格式

select DISTINCT year(Time) from rdata //從資料庫表中讀取時間篩選出年 select DISTINCT month (Time) from rdata //從資料庫表中讀取時間篩選出&

連結串列常用操作單鏈表反轉連結串列中環的檢測兩個有序的連結串列合併刪除連結串列倒數第 n 個結點求連結串列的中間結點

#include <stdio.h> #include <stdlib.h> /** * 1) 單鏈表反轉 * 2) 連結串列中環的檢測 * 3) 兩個有序的連結串列合併 * 4) 刪除連結串列倒數第 n 個結點 * 5) 求連結串列的中間

【PHP常見面試題程式功能設計】先寫一個線上留言本，實現使用者的線上留言功能，留言資訊儲存到資料庫，要求書籍資料表內容以及使用PHP編碼完成。

一、考點 1、資料表設計分析資料表結構留言板有哪些資訊需要儲存？留言資訊：ID，留言標題，留言內容，留言時間，留言人 2、資料表建立語句 // 留言本表 message create table message( id int unsign

從資料庫中匯出資料成Dataframe格式兩種方法效率比較

方法1： import pymysql import pandas as pd import time import xlrd first = time.time() #在資料庫中操作150s，在python中操作320s #方法1 con = pymysql.connect(host="

MySQL資料庫水平分表策略--一致性hash

一致性hash演算法緣起一致性雜湊演算法在1997年由麻省理工學院提出的一種分散式雜湊（DHT）實現演算法，設計目標是為了解決因特網中的熱點(Hot spot)問題，初衷和CARP十分類似。一致性雜湊修正了CARP使用的簡單雜湊演算法帶來的問題，使得分散式

MyBatis（三）解決設定資料庫自增後，導致兩表關聯插入的資料不匹配問題

最近在做關聯資料插入的時候，遇到一個問題，先描述一下我遇到的問題：有三張表：商品表：goods(id,name,price) 訂單表：payment（id,payment_date,count）關係表：relati

從檔案中讀取圖片，與從資料庫表中讀取圖片評測

一、在 d:\ 下建立 image 資料夾，再放10 張圖片，名稱從 1.png 到 10.png . 二、先建立新庫 db1, 然後按下面指令碼建立初始環境： USE db1 GO IF OBJECT_ID('t_path') IS NOT NULL DROP TABLE t_pat

SQL SERVER 資料庫表同步複製筆記 SqlServer2008 資料庫同步的兩種方式 (釋出、訂閱)

SQL SERVER 資料庫表同步複製筆記同步複製可執行在不同版本的SQL Server服務之間環境模擬需要兩臺資料庫192.168.1.1(釋出)，192.168.1.10(訂閱) 1、在釋出和訂閱機中建立兩個相同的賬戶(如: sqladmin)，使用者名稱和密碼都一致，隸屬於administr

如何從資料庫層面檢測兩表內容的一致性

相關推薦