1. 程式人生 > 資料庫 >PostgreSQL 重複資料處理的操作方法

PostgreSQL 重複資料處理的操作方法

PostgreSQL簡介

PostgreSQL是一種特性非常齊全的自由軟體的物件-關係型資料庫管理系統(ORDBMS),是以加州大學計算機系開發的POSTGRES,4.2版本為基礎的物件關係型資料庫管理系統。POSTGRES的許多領先概念只是在比較遲的時候才出現在商業網站資料庫中。PostgreSQL支援大部分的SQL標準並且提供了很多其他現代特性,如複雜查詢、外來鍵、觸發器、檢視、事務完整性、多版本併發控制等。同樣,PostgreSQL也可以用許多方法擴充套件,例如通過增加新的資料型別、函式、操作符、聚集函式、索引方法、過程語言等。另外,因為許可證的靈活,任何人都可以以任何目的免費使用、修改和分發PostgreSQL。

我們在使用postgresql資料庫的時候,如果一張資料表在未做任何約束的情況下,很可能會出現幾條完全一樣的資料,即重複資料。如下圖所示:

PostgreSQL 重複資料處理的操作方法

那麼如果我們要刪除其中的2條該怎麼辦呢?第一種我們可以清空表的內容,再使用INSERT INTO語句再將內容插入到表中。此方法可行,但對於專業人士來講,並不推薦

第二種我們可以結合pg資料庫中的ctid(和物理儲存有關,指的是一條記錄位於哪個資料塊的哪個位移上面)來進行刪除。這裡我們使用依然先使用SELECT語句進行查詢。

PostgreSQL 重複資料處理的操作方法

這樣我們就可以使用唯一標識的ctid對重複資料進行刪除操作,使用以下兩種方式都可以刪除tb_5201351表中2條資料。

DELETE FROM tb_5201351 WHERE ctid in ('(0,2)','(0,3)');

上面的方法原理是我們依次手工輸入要刪除指定ctid對應的資料,如果資料較多的話,我們還可以使用如下語句進行刪除。

DELETE FROM tb_5201351 WHERE ctid not in (select min(ctid) from tb_5201351);

執行後的結果如下圖所示:

PostgreSQL 重複資料處理的操作方法

到此這篇關於PostgreSQL 重複資料處理的操作方法的文章就介紹到這了,更多相關PostgreSQL 重複資料處理內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們!