吃相難看的mysql重複資料刪除

阿新 • • 發佈：2019-02-01

需求描述

資料庫為mysql , 清理資料要對重複歷史資料做刪除操作, 環境有以下特點
- 目標表沒有主鍵
- 不允許做表結構變動
- 重複資料並非全部欄位重複, 只是部分標誌欄位重複

解決思路與困境解決

最初的思路是按照指定欄位找出重複記錄集, 每組僅保留一條記錄, 其餘資料做刪除處理
偽sql實現如下:

delete from r_data_1d a 
where (a.c_res_id,a.c_task_time) in (select c_res_id,c_task_time from r_data_1d group by c_res_id,c_task_time having 
 count(*) > 1) 
and a.rowid not in (select min(rowid) from r_data_1d group by c_res_id,c_task_time having count(*)>1)

困境及解決方案:
1. mysql不支援rowid, 且表中沒有主鍵.
解決方案: 採取收集-刪除-增補三步走方式進行處理, 此處引進臨時表 r_data_1d_temp
2. 處理刪除步驟時, 發現mysql不支援對目標表進行刪除中查詢操作, 如該語句delete from a where a.b in (select b from a group by b having count(*) > 1)

解決方案: 採取收集-刪除兩步完成該步驟, 此處引進臨時表 r_data_1d_del_temp

最終方案

最終對上述步驟進行了整合, 簡單描述為收集補全-收集刪除資訊-執行刪除-執行補全
最終sql如下:

create r_data_1d_temp
select c_business_id, c_res_id , c_sub_res_id , max(c_in_avg), max(c_in_min), max(c_in_max), max(c_out_avg), max(c_out_min), max(c_out_max), c_task_time , c_tag1, c_tag2 from 
 (
select * from r_data_1d a where (a.c_res_id,a.c_task_time) in (select c_res_id,c_task_time from r_data_1d group by c_res_id,c_task_time having count(*) > 1) )a 
group by c_business_id, c_res_id, c_sub_res_id, c_task_time, c_tag1, c_tag2;

create table r_data_1d_del_temp select c_res_id,c_task_time from r_data_1d group by c_res_id,c_task_time having count(*) > 1;

delete from r_data_1d
where (c_res_id,c_task_time) in (select * from r_data_1d_del_temp);

drop table r_data_1d_del_temp;

insert into r_data_1d select * from r_data_1d_temp;

drop table r_data_1d_temp;

後記

目前該實現還是較為難看, 貼出來只是拋磚引玉, 希望能請到大神給出更優的解

吃相難看的mysql重複資料刪除

需求描述資料庫為mysql , 清理資料要對重複歷史資料做刪除操作, 環境有以下特點 - 目標表沒有主鍵 - 不允許做表結構變動 - 重複資料並非全部欄位重複, 只是部分標誌欄位重複解決思路與困境解決最初的思路是按照指定欄位找出重複記錄集,

mysql重複資料習題【題182. 查詢重複的電子郵箱+題196. 刪除重複的電子郵箱】

題182. 查詢重複的電子郵箱：思路：先GROUP BY分組，再HAVING過濾分組 SELECT Email FROM Person GROUP BY Email HAVING COUNT(*)>1 如果採用以下程式碼： SELECT p1.Email

Sql Server 查詢多條重複資料刪除並保留一條

總是不會查重和刪除多餘資料 delete sysdba.PRODUCT from sysdba.PRODUCT a where exists (select Name,ACTUALID fr

資料儲存－大資料：十問重複資料刪除技術

企業在選擇重複資料刪除產品時，最好想想下面的十個問題。儲存產品提供商在釋出一款重刪產品時，如何定位自己的產品，是不是也要想想下面的問題呢？ 1. 重複資料刪除技術對備份效能將產生什麼影響？ 2. 重複資料刪除會降低恢復資料的效能？ 3. 容量和效能擴充套件將如何隨著環境

C#返回arraylist集合長度的方法是什麼？C#ArrayList重複資料刪除

集合是 count(), 陣列是Length 那個是引用型別的問題，ArrayList.Contains(object)裡面的object比較的是引用(就像是一個指標)，object的引用要指向的實際值一致才返回true。要比較對像的實際值要用Equals(ob

Java 實現按行讀取檔案並且將行中的重複資料刪除

package com.gaden.delerepeat; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.InputStr

MySQL刪除重複資料，只保留其中最大id的一條

今天同事寫了個刪除重複資料保留一條記錄的資料庫語句，問我錯在哪兒，正好給大家講講【注：以下語句只單對MYSQL資料庫】語句 -- 問題： delete from `show` where id not in ( select MAX(id)

Mysql 刪除資料庫重複資料並保留 1 條記錄

查詢所有重複資料 SELECT * FROM table WHERE (col1,col2) IN (SELECT col1,col2 FROM table GROUP BY col1,col2 HAVING count(id) > 1); 由於Mysql 不能對

MySQL刪除重複資料的解決方案

對於重複的資料，有兩種情況： 1️⃣兩行資料完全相同 2️⃣某欄位相同 3️⃣id不同，其他欄位相同第1️⃣種情況的解決方案：思路： 1.查出表中所有行，不顯示重複行。 2.建立一張臨時表，儲存查到的新表資料。 3.刪除原表資料 4.把臨時表的資料插入到原表中。 5.刪除臨時

MySQL中刪除重複資料只保留一條

用SQL語句,刪除掉重複項只保留一條在幾千條記錄裡,存在著些相同的記錄,如何能用SQL語句,刪除掉重複的呢 1、查詢表中多餘的重複記錄，重複記錄是根據單個欄位（peopleId）來判斷 SELECT * FROM people WHERE pe

mysql中刪除重複記錄，並保留重複資料中的一條資料的SQL語句理解

正好想寫一條刪除重複語句並保留一條資料的SQL，網上查了一部分資料寫的很詳細，但還是在這裡寫下自己的理解，以遍後續學習。如下：表字段和資料： SQL語句： DELETE FROM `user` WHERE id NOT IN(SELECT * FROM(

Mysql資料庫刪除重複資料

最近因為發現數據庫中的表有髒資料，需要維護。這些髒資料就是重複資料，需要將其刪除。現假設有一張test表，主鍵欄位為num，還有id，one,two三個欄位。假設id規定只能有一條記錄（即需要為id建立聯合唯一索引）。表中資料如下：可以看出：表中資料明顯有不滿足條件的重複資料。解決方法：使用一

MySQL刪除重複資料

DELETE FROM dept WHERE db_source IN (SELECT db_source FROM (SELECT db_sourc

mysql 建立唯一索引前刪除重複資料只保留id最小一條。

首先，現在的需求是：表A有5個欄位A1，A2，A3，A4，A5。現在的唯一索引是A1+A2;因為業務的調整，需要改成A3+A4。解決辦法： 1、第一步很簡單，先drop掉原unique索引：A1+A2。 2、第二步，建立新unique，直接建立，想當然

mysql之刪除重複資料

//刪除id重複的資料，適合id是手工主鍵 delete person as a from person as a, ( select *,min(id) from person group by id having count(1) > 1 )

【mysql】sql刪除多個欄位重複資料有主鍵和沒主鍵解決方法

table user name age nub 張三 12 23 張三 12 23 張三 12 23 李四 13 21 李四 13 21 王五 11 25

MySQL刪除重複資料並保留ID最大值

DELETE a FROM user1 a JOIN ( SELECT user_name, count(*), MAX(id) AS i

【MySQL】常見的業務處理-刪除重複資料

業務場景日常工作中我們經常會遇到這樣的場景刪除資料庫中某個表中重複的資料。現在以一個案例驅動。需求：刪除評論表中同一訂單同一商品的重複評論，只保留最早的一條。上圖是商品評論表

MySQL 刪除表中重複資料，保留最小ID值

使用SQL語句，刪除表中重複的項，保留最小的ID；在表 tabel 1中，存在大量重複資料，需要刪除重複項，且儲存 ID 為最小的那條記錄。 tabel 1表中【jzmdid】資料重複 ID jzmdid aac002 aac003 yj_mo

Mysql 查詢表中重複資料和刪除表中重複的資料

1、根據指定條件查詢表中的重複記錄 select * from t_official_sys_user where USER_NAME in (select USER_NAME from (sel

吃相難看的mysql重複資料刪除

需求描述

解決思路與困境解決

最終方案

後記

相關推薦