【轉】PostgreSQL表膨脹的前世今生

阿新 • • 發佈：2022-03-29

當你的資料庫快速增長的時候，一定需要注意一件事，那就是“表膨脹”。內建的方法是使用VACUUM或者VACUUMFULL來解決表膨脹問題，但是有一些缺點。

[一、什麼是表膨脹]

PostgreSQL使用多版本模型MVCC。實現的方法和Oracle和MySQL不同，當執行update或者是delete的時，Oracle和MySQL會在undo中維護前映象，用於實現資料庫的一致性(C)。例如一箇舊事務依賴於已刪除的行，此行仍然對其可見，因為它的前映象依然儲存在undo中。而Oracledba經常會遇到ORA-01555錯誤，這個錯誤就是事務需要的前映象已經被覆蓋了。

但是這種問題不會在PostgreSQL中出現，因為PostgreSQL是在自己表中維護資料過去的版本和最新的版本。這也就是說在PG的概念中，Undo是存在自己的表裡。

下面我們通過Greenplum的官方文件的圖來說明，在PostgreSQL中磁碟儲存和記憶體中最小管理的單位都是Page。而Page中包含Tuple(元組)。元組是一種比較學術的說法，實際上可以理解成是資料庫中的行或者記錄。當資料庫插入一條記錄的時候，就會使用page中unused的空間，新增Tuple(元組)。如果Page空間滿了，就會使用新的Page。

delete操作，直接就是把元組標記為dead，並不會真正的從物理上刪除。Update操作會使用unused的空間建立一個新的元組，然後把舊的資料直接標記為dead。如果這個表上很頻繁的做事務，則會出現很多的deadtuple（元組），逐步堆積的deadtuple會將空間耗盡，同時當做全表掃描的時候會產生非常多的額外I/O，對查詢速度產生影響。

PostgreSQL具有VACUMM功能，主要有兩種方式，一種是VACUMM，另外一種是VACUMMFull。

VACUMM命令可以刪除deadtuple。如果刪除的記錄位於表的末端，其所佔用的空間將會被物理釋放並歸還給作業系統。如果不是末端資料，VACUMM會將死元組所佔用空間重置為可用狀態，那麼在今後有新資料插入時，將優先使用該空間，直到所有被重用的空間用完時，再考慮使用新增的磁碟頁面。

而VACUMMFULL不論被刪除的資料是否處於資料表的末端，這些資料所佔用的空間都將被物理的釋放並歸還於作業系統。之後再有新資料插入時，將分配新的磁碟頁面以供使用。同時，VACUMMFULL會上排他鎖。當你的表很大的時候，可能會鎖上幾個小時，任何基於該表的操作都會掛起。

[二、觀察表膨脹]

為了進一步觀察表膨脹現象，可以安裝pageinspect外掛。

postgres=# create extension pageinspect;

CREATE EXTENSION

create table test

(

id numeric,

name character varying(30)

);

postgres=# insert into test select generate_series(1,10),'A'||generate_series(1,10);

INSERT 0 10

postgres=# SELECT t_xmin, t_xmax, tuple_data_split('test'::regclass, t_data, t_infomask, t_infomask2, t_bits) FROM heap_page_items(get_raw_page('test', 0));

t_xmin | t_xmax | tuple_data_split

----------+--------+---------------------------------

17292510 | 0 | {"\\x0b00800100","\\x074131"}

17292510 | 0 | {"\\x0b00800200","\\x074132"}

17292510 | 0 | {"\\x0b00800300","\\x074133"}

17292510 | 0 | {"\\x0b00800400","\\x074134"}

17292510 | 0 | {"\\x0b00800500","\\x074135"}

17292510 | 0 | {"\\x0b00800600","\\x074136"}

17292510 | 0 | {"\\x0b00800700","\\x074137"}

17292510 | 0 | {"\\x0b00800800","\\x074138"}

17292510 | 0 | {"\\x0b00800900","\\x074139"}

17292510 | 0 | {"\\x0b00800a00","\\x09413130"}

(10 rows)

這裡我們建立了一個表，並插入了10行資料。這裡可以看到t_xmin代表著此行版本插入的事務ID。如果我們做update或者delete，就會產生新的行版本。下面我們來刪除5行記錄。

postgres=# delete from test where id <=5;

DELETE 5

postgres=# SELECT t_xmin, t_xmax, tuple_data_split('test'::regclass, t_data, t_infomask, t_infomask2, t_bits) FROM heap_page_items(get_raw_page('test', 0));

t_xmin | t_xmax | tuple_data_split

----------+----------+---------------------------------

17292510 | 17292511 | {"\\x0b00800100","\\x074131"}

17292510 | 17292511 | {"\\x0b00800200","\\x074132"}

17292510 | 17292511 | {"\\x0b00800300","\\x074133"}

17292510 | 17292511 | {"\\x0b00800400","\\x074134"}

17292510 | 17292511 | {"\\x0b00800500","\\x074135"}

17292510 | 0 | {"\\x0b00800600","\\x074136"}

17292510 | 0 | {"\\x0b00800700","\\x074137"}

17292510 | 0 | {"\\x0b00800800","\\x074138"}

17292510 | 0 | {"\\x0b00800900","\\x074139"}

17292510 | 0 | {"\\x0b00800a00","\\x09413130"}

(10 rows)

這裡可以看到，當我們刪除5條記錄，仍然有10條記錄。而被刪除的資料可以看到它的t_max事務id已經變成了刪除它們的事務id。這些已經刪除的記錄就類似於Oracle中的undo，仍然保留在同一表中，可以提供給比t_xmax較舊的事務使用。

postgres=# update test set name='st' where id=6;

UPDATE 1

postgres=# SELECT t_xmin, t_xmax, tuple_data_split('test'::regclass, t_data, t_infomask, t_infomask2, t_bits) FROM heap_page_items(get_raw_page('test', 0));

t_xmin | t_xmax | tuple_data_split

----------+----------+---------------------------------

17292510 | 17292511 | {"\\x0b00800100","\\x074131"}

17292510 | 17292511 | {"\\x0b00800200","\\x074132"}

17292510 | 17292511 | {"\\x0b00800300","\\x074133"}

17292510 | 17292511 | {"\\x0b00800400","\\x074134"}

17292510 | 17292511 | {"\\x0b00800500","\\x074135"}

17292510 | 17292517 | {"\\x0b00800600","\\x074136"}

17292510 | 0 | {"\\x0b00800700","\\x074137"}

17292510 | 0 | {"\\x0b00800800","\\x074138"}

17292510 | 0 | {"\\x0b00800900","\\x074139"}

17292510 | 0 | {"\\x0b00800a00","\\x09413130"}

17292517 | 0 | {"\\x0b00800600","\\x077374"}

如果我們做update的話，可以看到t_xmax為0的記錄仍然為5條，而多出來一條t_xmax為17292517的記錄。就如我們前面理論介紹的一樣，update產生了新的元組，而把舊記錄做為deadtuple。

接下來我們嘗試使用VACUUM來清理。

postgres=# vacuum test;

VACUUM

postgres=# SELECT t_xmin, t_xmax, tuple_data_split('test'::regclass, t_data, t_infomask, t_infomask2, t_bits) FROM heap_page_items(get_raw_page('test', 0));

t_xmin | t_xmax | tuple_data_split

----------+--------+---------------------------------

| |

17292510 | 0 | {"\\x0b00800700","\\x074137"}

17292510 | 0 | {"\\x0b00800800","\\x074138"}

17292510 | 0 | {"\\x0b00800900","\\x074139"}

17292510 | 0 | {"\\x0b00800a00","\\x09413130"}

17292517 | 0 | {"\\x0b00800600","\\x077374"}

(11 rows)

postgres=# update test set name='test' where id=7;

UPDATE 1

postgres=# SELECT t_xmin, t_xmax, tuple_data_split('test'::regclass, t_data, t_infomask, t_infomask2, t_bits) FROM heap_page_items(get_raw_page('test', 0));

t_xmin | t_xmax | tuple_data_split

----------+----------+-----------------------------------

17292571 | 0 | {"\\x0b00800700","\\x0b74657374"}

| |

17292510 | 17292571 | {"\\x0b00800700","\\x074137"}

17292510 | 0 | {"\\x0b00800800","\\x074138"}

17292510 | 0 | {"\\x0b00800900","\\x074139"}

17292510 | 0 | {"\\x0b00800a00","\\x09413130"}

17292517 | 0 | {"\\x0b00800600","\\x077374"}

(11 rows)

postgres=# vacuum full test;

VACUUM

postgres=# SELECT t_xmin, t_xmax, tuple_data_split('test'::regclass, t_data, t_infomask, t_infomask2, t_bits) FROM heap_page_items(get_raw_page('test', 0));

t_xmin | t_xmax | tuple_data_split

----------+----------+-----------------------------------

17292571 | 0 | {"\\x0b00800700","\\x0b74657374"}

17292510 | 17292571 | {"\\x0b00800700","\\x074137"}

17292510 | 0 | {"\\x0b00800800","\\x074138"}

17292510 | 0 | {"\\x0b00800900","\\x074139"}

17292510 | 0 | {"\\x0b00800a00","\\x09413130"}

17292517 | 0 | {"\\x0b00800600","\\x077374"}

(6 rows)

可以看到清理過後仍然有11條記錄。如果現在我們再次執行update更新，這個元組是可以在重新用到的。而使用了vacuumfull命令之後，記錄才下降到6條。把之前的deadtuple全部都清理了。

[三、表膨脹外掛]

前面說到使用vacuum和vacuumfull的功能之後。你會發現兩者都有一些缺陷。前者是不能回收空間，也就是會產生類似Oracle中的高水位的概念，而後者是能回收空間，但是會鎖表，當表足夠大的時候，會鎖上數個小時。會導致業務長時間中斷。那麼有什麼鎖表時間短而且能回收空間的方法嗎？當然，使用pg_repack和pg_squeeze外掛就能解決問題。兩個外掛都能解決這個問題，但是使用哪個更加好呢？

pg_squeeze外掛是cybertec公司貢獻的，而pg_repack外掛是自由軟體黑客DanieleVarrazzo所主導的。兩者都是C語言編寫。

兩者之間最大的不同就是pg_repack是通過觸發器功能來實現的，在重組的時候，額外使用觸發器會有一定的開銷，存在一定效能上的影響。而pg_squeeze，它是建立在邏輯複製基礎上的。它首先建立一個新的資料檔案快照，然後使用內建複製插槽以及邏輯解碼從XLOG提取對錶更改的記錄。然後重新構建表，構建完成之後再鎖表，切換FileNode。兩者實現方式不同。我個人比較傾向使用pg_squeeze外掛。

外掛安裝較為簡單。下載安裝包解壓，切換到postgres使用者，執行make和makeinstall就安裝好了。

裝完後需要修改資料庫引數和重啟，並在資料庫安裝外掛。

wal_level = logical

max_replication_slots = 10 # minimum 1

shared_preload_libraries = 'pg_squeeze'

create extension pg_squeeze;

接下來建立一個表來測試一下。

drop table test;

create table test

(

id numeric,

name character varying(30)

);

insert into test select generate_series(1,5000000),'A'||generate_series(1,5000000);

postgres=# SELECT pg_size_pretty(pg_relation_size('test'));

pg_size_pretty

----------------

211 MB

(1 row)

當我插入500萬記錄的時候，表大小是211MB，現在對錶做完全更新。

postgres=# update test set name='This is a test';

UPDATE 5000000

postgres=# select pg_size_pretty(pg_relation_size('test'));

pg_size_pretty

----------------

460 MB

(1 row)

現在全部更新完成時460MB，直接執行收縮。

postgres=# SELECT squeeze.squeeze_table('public', 'test', null, null, null);

ERROR: Table "public"."test" has no identity index

這裡報錯是表上需要主鍵才能執行收縮。

postgres=# alter table test add primary key(id);

ALTER TABLE

postgres=# select squeeze.squeeze_table('public', 'test', null, null, null);

squeeze_table

---------------

(1 row)

postgres=# select pg_size_pretty(pg_relation_size('test'));

pg_size_pretty

----------------

249 MB

(1 row)

重新建立主鍵後再次收縮，發現表大小已經從460MB下降到了249MB。回收效果還是很明顯。

pg_squeeze外掛還有一個比較優秀的功能就是能做成定時任務。首先我們可以把要回收的表插入到squeeze.tables表中，該表最後有一個欄位叫schedule，是一種自定義的型別，通過查詢squeeze.schedule的定義，可以發現和Linux中的crontab類似。

插入記錄如上圖所示，schedule設定為({5},{1},null,null,{6})，代表在每個週六晚上的1點05分會定時執行。

如果重組表的時候，其他使用者刪除表、修改表結構、或者始終無法獲取短暫的排他鎖、空間不足等問題都會造成重組失敗。可以通過檢視squeeze.errors表來定位錯誤。

參考文獻

PG_SQUEEZE:OPTIMIZING POSTGRESQL STORAGE

https://www.cybertec-postgresql.com/en/pg_squeeze-optimizing-postgresql-storage/

Understandingof Bloat and VACUUM in PostgreSQL

https://www.percona.com/blog/2018/08/06/basic-understanding-bloat-vacuum-postgresql-mvcc/

【轉】PostgreSQL表膨脹的前世今生

[一、什麼是表膨脹]

[二、觀察表膨脹]

[三、表膨脹外掛]

參考文獻

【轉】PostgreSQL表膨脹的前世今生

【轉】PowerDesigner表結構和欄位大小寫轉換

【轉】前端筆記之Vue（六）分頁排序|酷表單實戰&Vue-cli

3dTiles 資料規範詳解[3] 內嵌在瓦片檔案中的兩大資料表【轉】

【轉】C語言表驅動法程式設計實踐

【轉】c#判斷字串是否存在字母及字串中字元的替換例項

【轉】論c#如何將word檔案轉換成pdf檔案

Linux動態頻率調節系統CPUFreq之二：核心（core）架構與API【轉】

Windows CMD命令大全【轉】

C# 幾種常見資料結構【轉】

【轉】在linux下使用gcc/g++編譯多個.h檔案

SQL Server資料庫損壞、檢測以及簡單的修復辦法【轉】

php中cURL會話的curl_setopt的CURLOPT_HEADER和CURLOPT_RETURNTRANSFER引數的使用【轉】

php curl批處理--可控併發非同步【轉】

php讀取TXT檔案（帶換行、縮排）【轉】

前端上傳元件Plupload使用指南【轉】

JavaScript--on與addEventListener的使用與兩者的不同【轉】

Autofac-.net core控制檯使用依賴注入【轉】

html網頁重定向與跳轉幾種方法【轉】

【轉】混淆矩陣和ROC曲線

【轉】PostgreSQL表膨脹的前世今生

[一、什麼是表膨脹]

[二、觀察表膨脹]

[三、表膨脹外掛]

參考文獻

相關推薦