大廠高頻面試題：如何實現 MySQL 刪除重複記錄並且只保留一條？

阿新 • • 發佈：2020-12-16

最近在做題庫系統，由於在題庫中添加了重複的試題，所以需要查詢出重複的試題，並且刪除掉重複的試題只保留其中1條，以保證考試的時候抽不到重複的題。

關於MySQL的知識點總結了一個思維導圖，希望對大家所有幫助！

首先寫了一個小的例子：

一、單個欄位的操作

這是資料庫中的表：

分組介紹：

Select 重複欄位 From 表 Group By 重複欄位 Having Count(*)>1

檢視是否有重複的資料：

GROUP BY <列名序列>

HAVING <組條件表示式>

查詢出：根據dname分組，同時滿足having字句中組條件表示式（重複次數大於1）的那些組

count(*)與count(1) 其實沒有什麼差別，用哪個都可以

count(*)與count（列名）的區別：

count(*)將返回表格中所有存在的行的總數包括值為null的行，然而count(列名)將返回表格中除去null以外的所有行的總數(有預設值的列也會被計入）

1. 查詢全部重複的資料：

Select * From 表 Where 重複欄位 In (Select 重複欄位 From 表 Group By 重複欄位 Having Count(*)>1)

2. 刪除全部重複試題：

將上面的查詢select改為delete（這樣會出錯的）

DELETE
FROM
 dept
WHERE
 dname IN (
  SELECT
   dname
  FROM
   dept
  GROUP BY
   dname
  HAVING
   count(1) > 1
 )
複製程式碼

會出現如下錯誤：[Err] 1093 - You can't specify target table 'dept' for update in FROM clause

原因是：更新這個表的同時又查詢了這個表，查詢這個表的同時又去更新了這個表，可以理解為死鎖。mysql不支援這種更新查詢同一張表的操作

解決辦法：把要更新的幾列資料查詢出來做為一個第三方表，然後篩選更新。

3. 查詢表中多餘重複試題（根據depno來判斷，除了rowid最小的一個）

a. 第一種方法：

SELECT
 *
FROM
 dept
WHERE
 dname IN (
  SELECT
   dname
  FROM
   dept
  GROUP BY
   dname
  HAVING
   COUNT(1) > 1
 )
AND deptno NOT IN (
 SELECT
  MIN(deptno)
 FROM
  dept
 GROUP BY
  dname
 HAVING
  COUNT(1) > 1
)

上面這種寫法正確，但是查詢的速度太慢，可以試一下下面這種方法：

b. 第二種方法：

☆根據dname分組，查找出deptno最小的。然後再查詢deptno不包含剛才查出來的。這樣就查詢出了所有的重複資料（除了deptno最小的那行）

SELECT *
FROM
 dept
WHERE
 deptno NOT IN (
  SELECT
   dt.minno
  FROM
   (
    SELECT
     MIN(deptno) AS minno
    FROM
     dept
    GROUP BY
     dname
   ) dt
 )

c. 補充第三種方法（根據評論區給的刪除總結出來的）：

SELECT
 * 
FROM
 table_name AS ta 
WHERE
 ta.唯一鍵 <> ( SELECT max( tb.唯一鍵 ) FROM table_name AS tb WHERE ta.判斷重複的列 = tb.判斷重複的列 );

4. 刪除表中多餘重複試題並且只留1條：

a. 第一種方法：

DELETE
FROM
 dept
WHERE
 dname IN (
  SELECT
   t.dname
  FROM
   (
    SELECT
     dname
    FROM
     dept
    GROUP BY
     dname
    HAVING
     count(1) > 1
   ) t
 )
AND deptno NOT IN (
SELECT
 dt.mindeptno
FROM
 (
  SELECT
   min(deptno) AS mindeptno
  FROM
   dept
  GROUP BY
   dname
  HAVING
   count(1) > 1
 ) dt
)

b. ☆第二種方法（與上面查詢的第二種方法對應，只是將select改為delete）：

DELETE
FROM
 dept
WHERE
 deptno NOT IN (
  SELECT
   dt.minno
  FROM
   (
    SELECT
     MIN(deptno) AS minno
    FROM
     dept
    GROUP BY
     dname
   ) dt
 )

c. 補充第三種方法（評論區推薦的一種方法）：

DELETE 
FROM
 table_name AS ta 
WHERE
 ta.唯一鍵 <> (
SELECT
 t.maxid 
FROM
 ( SELECT max( tb.唯一鍵 ) AS maxid FROM table_name AS tb WHERE ta.判斷重複的列 = tb.判斷重複的列 ) t 
 );

二、多個欄位的操作：

單個欄位的如果會了，多個欄位也非常簡單。就是將group by 的欄位增加為你想要的即可。

此處只寫一個，其他方法請仿照一個欄位的寫即可。

DELETE
FROM
 dept
WHERE
 (dname, db_source) IN (
  SELECT
   t.dname,
   t.db_source
  FROM
   (
    SELECT
     dname,
     db_source
    FROM
     dept
    GROUP BY
     dname,
     db_source
    HAVING
     count(1) > 1
   ) t
 )
AND deptno NOT IN (
 SELECT
  dt.mindeptno
 FROM
  (
   SELECT
    min(deptno) AS mindeptno
   FROM
    dept
   GROUP BY
    dname,
    db_source
   HAVING
    count(1) > 1
  ) dt
)

總結：

其實上面的方法還有很多需要優化的地方，如果資料量太大的話，執行起來很慢，可以考慮加優化一下：

在經常查詢的欄位上加上索引
將*改為你需要查詢出來的欄位，不要全部查詢出來
小表驅動大表用IN，大表驅動小表用EXISTS。IN適合的情況是外表資料量小的情況，而不是外表資料大的情況，因為IN會遍歷外表的全部資料，假設a表100條，b表10000條那麼遍歷次數就是100*10000次，而exists則是執行100次去判斷a表中的資料是否在b表中存在，它只執行了a.length次數。至於哪一個效率高是要看情況的，因為in是在記憶體中比較的，而exists則是進行資料庫查詢操作的

小編總結了2020面試題，這份面試題的包含的模組分為19個模組，分別是： Java 基礎、容器、多執行緒、反射、物件拷貝、Java Web 、異常、網路、設計模式、Spring/Spring MVC、Spring Boot/Spring Cloud、Hibernate、MyBatis、RabbitMQ、Kafka、Zookeeper、MySQL、Redis、JVM 。

關注我的公眾號：程式設計師白楠楠，獲取上述資料。

大廠高頻面試題：如何實現 MySQL 刪除重複記錄並且只保留一條？

Mysql刪除重複記錄並且只保留一條

引用自：https://blog.csdn.net/n950814abc/article/details/82284838 作者：千g 找到重複記錄的sql

（轉）如何實現刪除重複記錄並且只保留一條？

最近，在做題庫系統，由於在題庫中添加了重複的試題，所以需要查詢出重複的試題，並且刪除掉重複的試題只保留其中1條，以保證考試的時候抽不到重複的題。

十年電商大廠面試官總結100道大廠高頻面試題：Dubbo，ElasticSearch，JVM，多執行緒/高併發，訊息中介軟體

從業十多年，我從一位嚮往大廠的面試者成為了一個大廠面試官，身邊很多從事Java 開發的朋友都不時諮詢如何才能進大廠。的確，進大廠對於大多數人來說，絕不只是談資，而是一種技術追求。像阿里、騰訊、位元

資料庫刪除重複的資料並且只保留一條資料

1、表結構與資料： CREATE TABLE tablezzl( id int, name VARCHAR(255) ); 2、查詢出重複的資料：

1000道一線網際網路大廠高頻面試題涵蓋：JVM+分散式+MySQL+併發+Spring全家桶+Redis+中介軟體等

小夥四面美團終拿下Offer，全靠刷了這1000道網際網路高頻面試筆記我一鐵哥們從去年到今年先後面試了 4次美團，外賣、訂單、商旅面試了好幾個部門，終於在今年年初成功拿下offer，總結下來各部門面試的大體思路

【LeetCode/LintCode】題解丨阿里高頻面試題：密碼強度檢查器

當以下條件都滿足時，一個密碼被視為是強密碼：至少包含6個字元，但不超過20個字元。

【LeetCode/LintCode】題解丨谷歌高頻面試題：最大假期天數

LintCode想讓它最好的員工之一選擇在N個城市間旅行來收集演算法問題。但是隻工作不玩耍，聰明的孩子也會變傻，你可以在某些特定的城市並且一個星期裡去度假。你的工作是安排旅行，儘可能多的假期，但是有一些規則和限

【LeetCode/LintCode】題解丨Google高頻面試題：在排序陣列中找最接近的K個數

給一個目標數 target, 一個非負整數 k, 一個按照升序排列的陣列 A。在A中找與target最接近的k個整數。返回這k個數並按照與target的接近程度從小到大排序，如果接近程度相當，那麼小

【LeetCode/LintCode】題解丨FLAG大廠經典面試題：島嶼的個數II

給定 n, m, 分別代表一個二維矩陣的行數和列數, 並給定一個大小為 k 的二元陣列A. 初始二維矩陣全0. 二元陣列A內的k個元素代表k次操作, 設第i個元素為 (A[i].x, A[i].y), 表示把二維矩陣中下標為A[i].x行A[i].y列

史上最全1000道Java高頻面試題：集合、IO流、多執行緒、網路、演算法、Git、設計模式、springboot

話不多說上乾貨這份資料包括： IDEA、Java語法、面向物件、異常、常用類、集合、IO流、多執行緒、網路程式設計、JUnit、列舉、註解、反射機制、CSS、HTML、JavaScript、JQuery、ajax、Javaweb、MySQL、Ja

大廠經典面試題：Redis為什麼這麼快？

前言我們都知道Redis很快，它QPS可達10萬（每秒請求數）。Redis為什麼這麼快呢,本文將跟大家一起學習。

資料庫索引高頻面試題：正則表示式學習之呼叫CLR函式執行正則查詢(1)

資料庫索引高頻面試題：正則表示式學習之呼叫CLR函式執行正則查詢(1) Regex re = new Regex(\"(?<=\\\"UserID\\\":\\\").*?(?=\\\")\", RegexOptions.IgnoreCase);

Android經典入門教程！最新Android大廠高頻面試題，面試題分享

Java相關無論什麼級別的Android從業者，Java作為Android開發基礎語言。不管是工作還是面試中，Java都是必考題。如果不懂Java的話，薪酬會非常吃虧（美團尤為重視Java基礎）

大廠高頻面試題——如何完全同時啟動兩個執行緒？

在很多面試場景和真實工作場景中，我們都會碰到多執行緒程式設計。多執行緒程式設計允許我們併發執行執行緒，其中每個執行緒可以處理不同的任務。因此，它可以最佳地利用系統資源，尤其當我們的計算機擁有多核 CPU

安卓rxjava開發pdf，2021Android大廠高頻面試題，細節爆炸

作為一個3-5年的Android工程師，我們經常會遇到這些瓶頸： 1.技術視野窄長期在小型軟體公司，外包公司工作，技術視野被限制的太厲害

2021Android大廠高頻面試題，Android入門視訊教程

Android面試題含答案 1、Activity生命週期？ onCreate() -> onStart() -> onResume() -> onPause() -> onStop() -> onDetroy()

Java大廠高頻面試題解析，Java基礎必背知識點

Java核心架構筆記大致如下 0~1年： Java基礎（基本語法、面向物件、繼承、多型、介面和抽象類、異常、內部類、集合、泛型、反射、I/O等）

2021Java大廠高頻面試題，Java工作資料

Netty實戰無論是想要學習Spring 5 、Spark、Cassandra等這樣的系統，還是通過學習Netty來構建自己的基於Java的高效能網路框架，或者是更加具體的高效能Web或者遊戲伺服器等，本書都將是你的超強拍檔。

中高階Java大廠高頻面試題，【Spring註解驅動開發

面試題如何保證快取與資料庫的雙寫一致性？面試官心理分析你只要用快取，就可能會涉及到快取與資料庫雙儲存雙寫，你只要是雙寫，就一定會有資料一致性的問題，那麼你如何解決一致性問題？

大廠高頻面試題：如何實現 MySQL 刪除重複記錄並且只保留一條？

一、單個欄位的操作

分組介紹：

1. 查詢全部重複的資料：

2. 刪除全部重複試題：

3. 查詢表中多餘重複試題（根據depno來判斷，除了rowid最小的一個）

a. 第一種方法：

b. 第二種方法：

c. 補充第三種方法（根據評論區給的刪除總結出來的）：

4. 刪除表中多餘重複試題並且只留1條：

a. 第一種方法：

b. ☆第二種方法（與上面查詢的第二種方法對應，只是將select改為delete）：

c. 補充第三種方法（評論區推薦的一種方法）：

二、多個欄位的操作：

總結：

相關推薦